摘要: 每天都被openai震撼到, 他们家被广为人知的产品是chatgpt,就是那个聊天工具。现在已经开始有越来越多的产品集成openai,比如微软的office,bing。 现在又一个工具出现,一个叫Cursor的编辑器已经集成了openai的GPT-4,而且还是免费的,它将彻底改变我们写代码的方式。 阅读全文
posted @ 2023-03-20 08:27 liuzhijun 阅读(583) 评论(0) 推荐(1) 编辑
摘要: ChatGPT去年已经在互联网技术圈里已经火了一把,现在似乎已经出圈,各行各业都在讨论,可以预见,ChatGPT是继互联网后的又一大技术革命。 如何才能体验ChatGPT呢?很多人卡在账号注册这一步,现在就来手把手教你如何成功注册ChatGPT,亲测有效。 ChatGPT是什么? ChatGPT的自 阅读全文
posted @ 2023-02-15 08:26 liuzhijun 阅读(1373) 评论(0) 推荐(0) 编辑
摘要: 经常逛GitHub的可能关注一个牛叉的项目,叫 What the f*ck Python! 这个项目列出了几乎所有python中那些鲜为人知的功能特性,有些功能第一次遇见时,你会冒出 what the f**k 的感叹。 因为这些例子看起来反人类直觉。 但是如果你理解了它背后的真正原理,你又会惊叹w 阅读全文
posted @ 2020-06-19 14:50 liuzhijun 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 我们开发的每个系统都离不开配置信息,例如数据库密码、Redis密码、邮件配置、各种第三方配置信息,这些信息都非常敏感,一旦泄露出去后果非常严重,被泄露的原因一般是程序员将配置信息和代码混在一起导致的。 判断一个系统是否正确地将配置排除在代码之外,一个简单的方法是看该系统的代码是否可以立刻开源,而不用 阅读全文
posted @ 2019-08-22 11:15 liuzhijun 阅读(754) 评论(0) 推荐(0) 编辑
摘要: 做过搜索的同学都知道,分词的好坏直接决定了搜索的质量,在英文中分词比中文要简单,因为英文是一个个单词通过空格来划分每个词的,而中文都一个个句子,单独一个汉字没有任何意义,必须联系前后文字才能正确表达它的意思。 因此,中文分词技术一直是nlp领域中的一大挑战。Python 中有个比较著名的分词库是结巴分词,从易用性来说对用户是非常友好的,但是准确度不怎么好。这几天发现另外一个库,pkuseg-python,看起来应该是北大的某个学生团队弄出来的,因为这方面没看到过多的介绍,pkuseg-python 的亮点是领域细分的中文分词工具,简单易用,跟现有开源工具相比提高了分词的准确率。 阅读全文
posted @ 2019-01-15 10:26 liuzhijun 阅读(1531) 评论(0) 推荐(0) 编辑
摘要: 为程序员,如果学了一堆技术却没有用武之地,实在可惜,如何把自己积累的技术利用起来?通俗一点,程序员有哪些赚钱的门路? 比较常见的一种方式是接私活,不过私活的复杂度不一,沟通成本会非常高,另一方面,私活的技术含量低,对程序员的技术成长没什么帮助,什么样的赚钱指导是理想选择,我想能够躺着把钱挣的路子应该是个好点子 你不是苍老师,能躺着把钱赚了?答案是肯定的,那些互联网巨头们现在无一不是躺着在赚钱,现在你差的不是一个程序员,而是缺一个 idea,如何找到靠谱的想法? 那些曾经不起眼的网站、APP 最初都是从解决某个痛点做起的,比如 hao123,一个当初 "看起来"没技术含量的网址导航网站以上千万的现金股票被百度收购就是一个经典案例,它为什么这么值钱?因为它解决了互联网小白记不住网址,懒得输网址的这群用户的需求。hao123 创始人李兴平自己其实也是小白用户,他为了解决自己的痛点,于是就有了hao123 阅读全文
posted @ 2017-06-24 12:42 liuzhijun 阅读(471) 评论(1) 推荐(2) 编辑
摘要: 正则表达式处理文本有如疾风扫秋叶,绝大部分编程语言都内置支持正则表达式,它应用在诸如表单验证、文本提取、替换等场景。爬虫系统更是离不开正则表达式,用好正则表达式往往能收到事半功倍的效果。 介绍正则表达式前,先来看一个问题,下面这段文本来自豆瓣的某个网页链接,我对内容进行了缩减。问:如何提取文本中所有邮箱地址呢? 阅读全文
posted @ 2017-05-25 10:02 liuzhijun 阅读(1169) 评论(0) 推荐(1) 编辑
摘要: 什么是闭包?闭包有什么用?为什么要用闭包?今天我们就带着这3个问题来一步一步认识闭包。闭包和函数紧密联系在一起,介绍闭包前有必要先介绍一些背景知识,诸如嵌套函数、变量的作用域等概念 阅读全文
posted @ 2017-05-15 11:21 liuzhijun 阅读(370) 评论(0) 推荐(0) 编辑
摘要: 在爬虫系列文章 优雅的HTTP库requests 中介绍了 requests 的使用方式,这一次我们用 requests 构建一个知乎 API,功能包括:私信发送、文章点赞、用户关注等,因为任何涉及用户操作的功能都需要登录后才操作,所以在阅读这篇文章前建议先了解Python模拟知乎登录 。现在假设你已经知道如何用 requests 模拟知乎登录了。 阅读全文
posted @ 2017-04-17 13:48 liuzhijun 阅读(1735) 评论(3) 推荐(1) 编辑
摘要: Python 提供了很多模块来基于 HTTP 协议的网络编程,urllib、urllib2、urllib3、httplib、httplib2,都是和 HTTP 相关的模块,看名字觉得很反人类,更糟糕的是这些模块在 Python2 与 Python3 中有很大的差异,如果业务代码要同时兼容 2 和 3,写起来会让人崩溃。 幸运地是,繁荣的 Python 社区给开发者带来了一个非常惊艳的 HTTP 库 requests,一个真正给人用的HTTP库。它是 GitHUb 关注数最多的 Python 项目之一,requests 的作者是 Kenneth Reitz 大神。 阅读全文
posted @ 2017-04-13 18:16 liuzhijun 阅读(1291) 评论(0) 推荐(0) 编辑