Kingname: Follow RSS Feed & Discover Posts

Back to Discover

给时光以生命。

148 followers 0 articles/week

我经常逛Github Trend，看看每天有没有什么高级的开源项目出来。有时候发现一个项目非常好，想跟开发者交流。一般情况下，开发者会在Github主页留下自己的联系邮箱，如下图所示，这是我的Github个人主页：但有的开发者却不会留邮箱，如下图所示：这种情况下，怎么联系上这个开发者呢？你可以直接发Issue，但是这样其他人就能看到你发的消息。其实还有一个更简单隐蔽的方法，可以直接拿到这个开发者的邮箱。首先，在这个开发者的Repo中，随便找一条Commit记录，如下图所示：这个Commit对应的URL是：https://github.com/didi/xiaoju-survey/commit/3dc15aeb688f04dfdf69f0f46b0f66902303f92d。现在，只需要在这个URL的末尾加上.patch，变成https://github.com/didi/xiaoju-survey/commit/3dc15aeb688f04dfdf69f0f46b0f66902303f92d.patch，就可以看到纯文本形式的Commit记录。而开发者的邮箱地址就在上面，如下图所示：

Sun Jun 2, 2024 17:18

一日一技：如何正确处理多行字符串的缩进问题

有时候，我们需要使用多行字符串配合format格式化函数来生成Markdown文本。例如，我现在开发了一个AI对话机器人，我发送一个txt文件过去，他首先帮我总结整个文件的内容，然后以问答的形式列出10个要点。你的代码可能是这样写的：1 2 3 4 5 6 7 8 9 10 11 12 13 14 def bot(text): summary = summary_text_by_gpt(text) qa = get_qa_by_gpt(text) output = ''' ## 文本总结 {summary} ## 核心问答 {qa} ''' return output 返回Markdown以后，通过前端渲染出正常的文本。但如果你直接这样写，你会发现Markdown的渲染好像出问题了。如下图所示：为什么会出现这个问题呢？其实很简单，因为你的Markdown文本有问题。我们来看一下正常的Markdown长什么样：...

Tue May 28, 2024 16:06

一日一技：为什么这个JSON无法解析？

我们知道，Python里面，json.dumps是序列化操作，json.loads是反序列化操作。当我使用json.dumps把一个字典转换为字符串以后，也可以使用json.loads把这个字符串转换为字典。那么，有没有可能出现这样的情况：某个字典，使用json.dumps转换成了字符串s。但是当我使用json.loads(s)时，却会报错？你别不信，我们来做一个实验。执行下面这段代码，打印出一段JSON字符串：1 2 3 4 5 6 7 8 9 10 11 12 13 import json text = '''## 摘要这篇文章主要包含xx和yy ## 详情 1. abc 2. def ''' item = {'title': '关于abc', 'raw': text} output...

Tue May 28, 2024 16:06

一日一技：效率翻倍，国产大模型App的正确应用

利益不相关声明，今天介绍的所有工具，都跟我没有任何软文合作，也没有金钱往来。我在这篇文章里面对他们做介绍仅仅是因为他们对我确实非常有用。最近几个月，国产大模型相继推出了自己的 App，这些 App 不仅可进行 AI 对话，还能提供各种智能工具。谈论AI对话功能的文章太多了，我就不赘述了。今天聊聊他们的其他功能。不可否认，国产大模型比国外的大模型差了不少，但我一向秉持重器轻用的观点，我不管这些App提供了多少功能，我只看它里面有没有功能适合我，即便它提供了100个功能，我可能只会使用它其中一个适合我的功能。第一个介绍的工具是豆包中的语音识别功能。虽然字节跳动的大模型做得很一般，在国内都排不上前三名。但我发现豆包的语音识别做的非常好——速度极快，准确率也很高。而且可以让他们的模型对转录出来的文本做一些修饰，移除口癖，并把口语化的表达改写成书面化的表达。现在这篇文章中的大部分文字，都是我开车等红灯的时候，通过口述写下来的。如下图所示：...

Sun May 5, 2024 09:55

一日一技：如何强迫LLama3用中文回复？

最近大家都在说LLama3如何如何强大，追赶Claude3，超过GPT 4。但如果大家真的使用过，就会发现它连基本的中文都回答不好。如下图所示： LLama3总是尽可能回复英文，并且还会加很多表情符号。今天网上出现了一个中文微调版的LLama3:shenzhi-wang/Llama3-8B-Chinese-Chat，我也下载下来使用了，发现确实回复都是中文了，但回复的都是车轱辘话，一句话反复说。如下图所示：那么有没有什么办法，能够让LLama3既能回复中文，又能回复得聪明一些呢？网上有一段“生气的老奶奶”Prompt，可以尽可能让LLama3满足要求：1 2 3 4 5 6 问题 Rules: - Be precise, do not reply emoji. - Always response...

Tue Apr 23, 2024 17:02

一日一技：2秒抓取网页并转换为markdown

在《一日一技：自动提取任意信息的通用爬虫》这篇文章中，我提到可以通过大模型从网页内容里面提取结构化信息。为了节省Token，文章里面我直接提取了页面上的所有文本。这种方式需要自己写代码来过滤HTML中的垃圾标签。并且提取出来的文本可能会混在一起。虽然大模型在很大程度上不会受到标点符号的影响。但如果有办法把网页直接转换为Markdown的话，大模型在解析时就能更加准确。现在，你不需要写任何代码就可以实现这个目标！假设我们需要抓取我的这篇知乎专栏文章：小问题，大隐患：如何正确设置 Python 项目的入口文件？。我们知道知乎是有反爬虫的，直接抓取并不容易。怎么样在2秒内抓取这篇文章，并转换为Markdown呢？非常简单，你只需要在url前面加上https://r.jina.ai/并回车就可以了。完整的URL变成：https://r.jina.ai/https://zhuanlan.zhihu.com/p/351326998。浏览器上面的效果如下图所示：...

Wed Apr 17, 2024 18:50

Build your own newsfeed

Ready to give it a go?
Start a 14-day trial, no credit card required.

Create account