给时光以生命。
148 followers 0 articles/week
一日一技:如何找到Github用户的邮箱?

我经常逛Github Trend,看看每天有没有什么高级的开源项目出来。有时候发现一个项目非常好,想跟开发者交流。一般情况下,开发者会在Github主页留下自己的联系邮箱,如下图所示,这是我的Github个人主页:但有的开发者却不会留邮箱,如下图所示:这种情况下,怎么联系上这个开发者呢?你可以直接发Issue,但是这样其他人就能看到你发的消息。其实还有一个更简单隐蔽的方法,可以直接拿到这个开发者的邮箱。首先,在这个开发者的Repo中,随便找一条Commit记录,如下图所示:这个Commit对应的URL是:https://github.com/didi/xiaoju-survey/commit/3dc15aeb688f04dfdf69f0f46b0f66902303f92d。现在,只需要在这个URL的末尾加上.patch,变成https://github.com/didi/xiaoju-survey/commit/3dc15aeb688f04dfdf69f0f46b0f66902303f92d.patch,就可以看到纯文本形式的Commit记录。而开发者的邮箱地址就在上面,如下图所示:

Sun Jun 2, 2024 17:18
一日一技:如何正确处理多行字符串的缩进问题

有时候,我们需要使用多行字符串配合format格式化函数来生成Markdown文本。例如,我现在开发了一个AI对话机器人,我发送一个txt文件过去,他首先帮我总结整个文件的内容,然后以问答的形式列出10个要点。你的代码可能是这样写的:1 2 3 4 5 6 7 8 9 10 11 12 13 14 def bot(text): summary = summary_text_by_gpt(text) qa = get_qa_by_gpt(text) output = ''' ## 文本总结 {summary} ## 核心问答 {qa} ''' return output 返回Markdown以后,通过前端渲染出正常的文本。但如果你直接这样写,你会发现Markdown的渲染好像出问题了。如下图所示:为什么会出现这个问题呢?其实很简单,因为你的Markdown文本有问题。我们来看一下正常的Markdown长什么样:...

Tue May 28, 2024 16:06
一日一技:为什么这个JSON无法解析?

我们知道,Python里面,json.dumps是序列化操作,json.loads是反序列化操作。当我使用json.dumps把一个字典转换为字符串以后,也可以使用json.loads把这个字符串转换为字典。那么,有没有可能出现这样的情况:某个字典,使用json.dumps转换成了字符串s。但是当我使用json.loads(s)时,却会报错?你别不信,我们来做一个实验。执行下面这段代码,打印出一段JSON字符串:1 2 3 4 5 6 7 8 9 10 11 12 13 import json text = '''## 摘要 这篇文章主要包含xx和yy ## 详情 1. abc 2. def ''' item = {'title': '关于abc', 'raw': text} output...

Tue May 28, 2024 16:06
一日一技:效率翻倍,国产大模型App的正确应用

利益不相关声明,今天介绍的所有工具,都跟我没有任何软文合作,也没有金钱往来。我在这篇文章里面对他们做介绍仅仅是因为他们对我确实非常有用。最近几个月,国产大模型相继推出了自己的 App,这些 App 不仅可进行 AI 对话,还能提供各种智能工具。谈论AI对话功能的文章太多了,我就不赘述了。今天聊聊他们的其他功能。不可否认,国产大模型比国外的大模型差了不少,但我一向秉持重器轻用的观点,我不管这些App提供了多少功能,我只看它里面有没有功能适合我,即便它提供了100个功能,我可能只会使用它其中一个适合我的功能。第一个介绍的工具是豆包中的语音识别功能。虽然字节跳动的大模型做得很一般,在国内都排不上前三名。但我发现豆包的语音识别做的非常好——速度极快,准确率也很高。而且可以让他们的模型对转录出来的文本做一些修饰,移除口癖,并把口语化的表达改写成书面化的表达。现在这篇文章中的大部分文字,都是我开车等红灯的时候,通过口述写下来的。如下图所示:...

Sun May 5, 2024 09:55
一日一技:如何强迫LLama3用中文回复?

最近大家都在说LLama3如何如何强大,追赶Claude3,超过GPT 4。但如果大家真的使用过,就会发现它连基本的中文都回答不好。如下图所示: LLama3总是尽可能回复英文,并且还会加很多表情符号。今天网上出现了一个中文微调版的LLama3:shenzhi-wang/Llama3-8B-Chinese-Chat,我也下载下来使用了,发现确实回复都是中文了,但回复的都是车轱辘话,一句话反复说。如下图所示:那么有没有什么办法,能够让LLama3既能回复中文,又能回复得聪明一些呢?网上有一段“生气的老奶奶”Prompt,可以尽可能让LLama3满足要求:1 2 3 4 5 6 问题 Rules: - Be precise, do not reply emoji. - Always response...

Tue Apr 23, 2024 17:02
一日一技:2秒抓取网页并转换为markdown

在《一日一技:自动提取任意信息的通用爬虫》这篇文章中,我提到可以通过大模型从网页内容里面提取结构化信息。为了节省Token,文章里面我直接提取了页面上的所有文本。这种方式需要自己写代码来过滤HTML中的垃圾标签。并且提取出来的文本可能会混在一起。虽然大模型在很大程度上不会受到标点符号的影响。但如果有办法把网页直接转换为Markdown的话,大模型在解析时就能更加准确。现在,你不需要写任何代码就可以实现这个目标!假设我们需要抓取我的这篇知乎专栏文章:小问题,大隐患:如何正确设置 Python 项目的入口文件?。我们知道知乎是有反爬虫的,直接抓取并不容易。怎么样在2秒内抓取这篇文章,并转换为Markdown呢?非常简单,你只需要在url前面加上https://r.jina.ai/并回车就可以了。完整的URL变成:https://r.jina.ai/https://zhuanlan.zhihu.com/p/351326998。浏览器上面的效果如下图所示:...

Wed Apr 17, 2024 18:50

Build your own newsfeed

Ready to give it a go?
Start a 14-day trial, no credit card required.

Create account