Fork me on GitHub

随笔分类 -  python

摘要:预处理操作是机器学习整个周期中必不可少的一个过程,也是最能快速改善模型性能的一个过程,往往稍微转换一下特征属性的形态,就能得到性能的极大提升。当然,数据预处理绝对也是耗时最长的一个过程,这一过程不仅要求洞悉整个数据集结构分布,还要探查每一个特征属性细节情况,并作出应对处理,使数据以最适合的状态传输给模型。 针对预处理操作,sklearn中提供了许多模块工具,灵活使用工具可以让数据预处理轻松很多。 本文简要介绍数据预处理中的一些主要方法,并结合sklearn中提供的模块进行实践。 阅读全文
posted @ 2019-12-17 07:51 奥辰 阅读(2072) 评论(0) 推荐(2)
摘要:本文总结TensorFlow2.0中均方差损失函数和交叉熵损失函数。 阅读全文
posted @ 2019-10-23 16:48 奥辰 阅读(5130) 评论(0) 推荐(0)
摘要:激活函数是深度学习,亦或者说人工神经网络中一个十分重要的组成部分,它可以对神经元的接收信息进行非线性变换,将变换后的信息输出到下一层神经元。 阅读全文
posted @ 2019-10-21 08:03 奥辰 阅读(2904) 评论(0) 推荐(0)
摘要:在整个机器学习过程中,除了训练模型外,应该就属数据预处理过程消耗的精力最多,数据预处理过程需要完成的任务包括数据读取、过滤、转换等等。为了将用户从繁杂的预处理操作中解放处理,更多地将精力放在算法建模上,TensorFlow中提供了data模块,这一模块以多种方式提供了数据读取、数据处理、数据保存等功能。本文重点是data模块中的Dataset对象。 阅读全文
posted @ 2019-10-14 08:13 奥辰 阅读(16431) 评论(4) 推荐(4)
摘要:总结TensorFlow2.0中实现张量限幅功能的多个api,包括 maxmium()、minmium()、clip_by_value()、relu()、cli_by_norm()、clip_by_global_norm() 阅读全文
posted @ 2019-10-08 22:02 奥辰 阅读(1443) 评论(0) 推荐(1)
摘要:总结TensorFlow2.0中几个填充复制功能的api。 阅读全文
posted @ 2019-10-07 16:54 奥辰 阅读(4619) 评论(0) 推荐(1)
摘要:总结TensorFlow2.0中排序,求最大值、最小值、平均值等方法,涉及sort()、argsort()、reduce_min()、reduce_max()、redece_mean()、argmin()、argmax()等方法。 阅读全文
posted @ 2019-10-02 16:22 奥辰 阅读(5451) 评论(0) 推荐(0)
摘要:TensorFlow2.0张量数学运算,包括加(+)、减(-)、点乘(*)、除(/)、地板除法(//)、取余(%)、指数运算、对数运算、矩阵相乘、范数等。 阅读全文
posted @ 2019-09-26 20:33 奥辰 阅读(4706) 评论(1) 推荐(3)
摘要:TensorFlow2.0版本已经发布,虽然不是正式版,但预览版都发布了,正式版还会远吗?相比于1.X,2.0版的TensorFlow修改的不是一点半点,这些修改极大的弥补了1.X版本的反人类设计,提升了框架的整体易用性,绝对好评! 赶紧来学习一波吧,做最先吃螃蟹的那一批人!先从TensorFlow的基本数据结构——张量(tensor)开始。 阅读全文
posted @ 2019-09-21 10:29 奥辰 阅读(6150) 评论(2) 推荐(3)
摘要:数据分析、数据挖掘、可视化是Python的众多强项之一,但无论是这几项中的哪一项都必须以数据作为基础,数据通常都存储在外部文件中,例如txt、csv、excel、数据库。本篇中,我们来捋一捋Python中那些外部数据文件读取、写入的常用方法 阅读全文
posted @ 2019-09-06 17:31 奥辰 阅读(9098) 评论(0) 推荐(3)
摘要:本文大致介绍了Pandas中的两种重要数据结构Series数组对象和DataFrame数组对象的特点、主要创建方法、属性。对于从数组对象中进行切片、索引数据的方法 阅读全文
posted @ 2019-08-30 17:05 奥辰 阅读(7345) 评论(0) 推荐(0)
摘要:本文是作为Python数据分析入门系列博客,详细介绍了numpy最基本、最常用、最重要的数据结构——ndarray数组的使用。 阅读全文
posted @ 2019-08-26 15:31 奥辰 阅读(13849) 评论(0) 推荐(6)
摘要:装饰器(Decorators)可能是Python中最难掌握的概念之一了,也是最具Pythonic特色的技巧,深入理解并应用装饰器,你会更加感慨——人生苦短,我用Python。 阅读全文
posted @ 2019-08-17 17:08 奥辰 阅读(3306) 评论(2) 推荐(6)
摘要:本文结合对Flask源码的分析总结分析了Flask配置管理的使用方法。Flask通过Config配置类中的6个方法,对应得提供了6种配管管理方式。本文通过代码实例演示每种方式的使用方法,还深度剖析了源码,总结思路,相信你不进可以知其然还可以知其所以然。 阅读全文
posted @ 2019-08-13 16:37 奥辰 阅读(1209) 评论(0) 推荐(1)
摘要:只要你学了Python语言,就不会不知道for循环,也肯定用for循环来遍历一个列表(list),那为什么for循环可以遍历list,而不能遍历int类型对象呢?怎么让一个自定义的对象可遍历? 这篇博客中,我们来一起探索一下这个问题,在这个过程中,我们会介绍到迭代器、可迭代对象、生成器,更进一步的,我们会详细介绍他们的原理、异同。 阅读全文
posted @ 2019-08-02 15:27 奥辰 阅读(7496) 评论(6) 推荐(17)
摘要:pymysql是Python操作mysql的最主要方法,本文详细介绍pymysql的建库、建表和增删改查操作。 阅读全文
posted @ 2019-07-24 22:04 奥辰 阅读(4580) 评论(0) 推荐(3)
摘要:线性回归算法应该是大多数人机器学习之路上的第一站,因为线性回归算法原理简单清晰,但却囊括了拟合、优化等等经典的机器学习思想。本篇详细介绍了线性回归算法的原理,并在最后使用代码实现了线性回归算法。 阅读全文
posted @ 2019-07-21 21:00 奥辰 阅读(1772) 评论(0) 推荐(0)
摘要:当使用selenium+webdriver写爬虫被检测到时,pyppeteer是你得不二选择,几乎所有能在人工操作浏览器进行的操作通过pyppeteer都能实现,且能完美避开官方对webdriver的检测。 阅读全文
posted @ 2019-06-08 08:25 奥辰 阅读(19612) 评论(4) 推荐(4)
摘要:本文记录了一次某主流电商平台网络爬虫js逆向解密经历。 阅读全文
posted @ 2019-05-29 20:43 奥辰 阅读(13141) 评论(5) 推荐(4)
摘要:scrapy-redis是对scrapy改进,在分布式爬虫开发上有卓越的表现,但由于scrapy-redis只从redis中读取起始url,导致发送POST困难,本文从源码出发,逐步探寻、解释scrapy-redis实例化request对象流程,并通过美团爬虫实例演示scrapy-redis框架发送POST请求方法。 阅读全文
posted @ 2019-05-15 07:32 奥辰 阅读(2921) 评论(0) 推荐(0)