摘要: `pandas`小技巧系列是介绍的是使用`pandas`分析数据时,最常用的一些操作技巧。 具体包括: 1. [创建测试数据](https://www.cnblogs.com/wang_yb/p/17552748.html) 学习pandas的过程中,为了尝试pandas提供的各类功能强大的函数,常 阅读全文
posted @ 2023-08-28 21:09 wang_yb 阅读(141) 评论(0) 推荐(0) 编辑
摘要: manim是一个生成数学教学视频的动画引擎。 它用编程的方式创建精美的数学动画,让数学更加易懂。 本教程简单介绍了 manim 的基本使用方式,基于 v0.17.2 版本 manim 安装 manim是基于python语言开发的开源框架,是由 3blue1brown 开发的。 本来是他们自己用来制作 阅读全文
posted @ 2023-04-22 14:26 wang_yb 阅读(756) 评论(1) 推荐(1) 编辑
摘要: 读完这本书回过头才发现, 第一篇笔记居然是 2012年8月发的, 将近一年半的时间才看完这本书(汗!!!).为了方便以后查看, 做个《Linux内核设计与实现》读书笔记 的目录:《Linux内核设计与实现》读书笔记(一)-内核简介《Linux内核设计与实现》读书笔记(二)- 内核开发的准备《Linu... 阅读全文
posted @ 2014-01-11 09:56 wang_yb 阅读(32633) 评论(12) 推荐(23) 编辑
摘要: 搜索引擎对互联网的重要性不言而喻,不过,随着ChatGPT及其类似AI工具的推出,对搜索引擎带来了前所未有的挑战。 因为ChatGPT具有自然语言处理能力,能够更好地理解用户的搜索意图,提供更准确、更相关的搜索结果。同时,还可以根据用户的搜索历史和行为数据,为用户提供更加个性化的搜索体验,推荐更符合 阅读全文
posted @ 2024-02-19 16:22 wang_yb 阅读(439) 评论(0) 推荐(7) 编辑
摘要: gRPC是一个高性能、开源、通用的远程过程调用(RPC)框架,由Google推出。它基于HTTP/2协议标准设计开发,默认采用Protocol Buffers数据序列化协议,支持多种开发语言。 在gRPC中,客户端可以像调用本地对象一样直接调用另一台不同的机器上服务端应用的方法,使得您能够更容易地创 阅读全文
posted @ 2024-02-18 18:44 wang_yb 阅读(225) 评论(0) 推荐(2) 编辑
摘要: pandas的DataFrame功能强大自不必说,它可以帮助我们极大的提高统计分析的效率。 不过,使用DataFrame开发我们的分析程序的时候,经常需要打印出DataFrame的内容,以验证和调试数据的处理是否正确。 在命令行中虽然可以直接打印出DataFrame的内容,但是阅读比较困难。正好前段 阅读全文
posted @ 2024-02-13 19:05 wang_yb 阅读(204) 评论(0) 推荐(2) 编辑
摘要: Rich库的功能就像它的名字一样,使Python编程更加丰富(rich),它帮助开发者在控制台(命令行)输出中创建丰富、多彩和具有格式化的文本。 本篇总结了如何使用Rich库让我们的命令行工具更加美观。 1. 安装 通过pip安装: pip install rich 使用下面的命令验证是否安装成功。 阅读全文
posted @ 2024-02-12 16:55 wang_yb 阅读(469) 评论(0) 推荐(1) 编辑
摘要: 模型持久化(模型保存与加载)是机器学习完成的最后一步。因为,在实际情况中,训练一个模型可能会非常耗时,如果每次需要使用模型时都要重新训练,这无疑会浪费大量的计算资源和时间。 通过将训练好的模型持久化到磁盘,我们可以在需要使用模型时直接从磁盘加载到内存,而无需重新训练。这样不仅可以节省时间,还可以提高 阅读全文
posted @ 2024-02-08 15:48 wang_yb 阅读(125) 评论(0) 推荐(1) 编辑
摘要: 之前介绍过Python的Fire库,一个用来生成命令行工具的的库。请参考:Python Fire:自动生成命令行接口 今天,针对命令行参数,补充两种更加灵活的设置方式。 1. *args 型参数 *args型的参数可以接受任意长度的参数。比如,模拟一个学校发送通知的功能: import fire d 阅读全文
posted @ 2024-02-05 14:18 wang_yb 阅读(239) 评论(0) 推荐(2) 编辑
摘要: 分类模型评估时,scikit-learn提供了混淆矩阵和分类报告是两个非常实用且常用的工具。它们为我们提供了详细的信息,帮助我们了解模型的优缺点,从而进一步优化模型。 这两个工具之所以单独出来介绍,是因为它们的输出内容特别适合用在模型的评估报告中。 1. 混淆矩阵 混淆矩阵(Confusion Ma 阅读全文
posted @ 2024-02-04 09:33 wang_yb 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 命令行程序是平时写一些小工具时最常用的方式。 为了让命令行程序更加灵活,我们常常会设置一些参数,根据参数让程序执行不同的功能。这样就不用频繁的修改代码来执行不同的功能。 随着命令行程序功能的丰富,也就是参数多了以后,解析和管理参数之间的关系会变得越来越繁重。而本次介绍的 Fire 库,正好可以解决这 阅读全文
posted @ 2024-02-01 10:15 wang_yb 阅读(232) 评论(0) 推荐(1) 编辑
摘要: 前面两篇介绍了分类模型评估的两类方法,准确率分析和损失分析,本篇介绍的杰卡德相似系数和马修斯相关系数为我们提供了不同的角度来观察模型的性能,尤其在不平衡数据场景中,它们更能体现出其独特的价值。 接下来,让我们一起了解这两个评估指标的原理与特点。 1. 杰卡德相似系数 杰卡德相似系数(Jaccard 阅读全文
posted @ 2024-01-31 14:20 wang_yb 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 分类模型评估中,通过各类损失(loss)函数的分析,可以衡量模型预测结果与真实值之间的差异。不同的损失函数可用于不同类型的分类问题,以便更好地评估模型的性能。 本篇将介绍分类模型评估中常用的几种损失计算方法。 1. 汉明损失 Hamming loss(汉明损失)是一种衡量分类模型预测错误率的指标。它 阅读全文
posted @ 2024-01-30 16:08 wang_yb 阅读(167) 评论(0) 推荐(1) 编辑