python - 随笔分类(第2页) - 奥辰

scikit-learn与数据预处理

摘要：预处理操作是机器学习整个周期中必不可少的一个过程，也是最能快速改善模型性能的一个过程，往往稍微转换一下特征属性的形态，就能得到性能的极大提升。当然，数据预处理绝对也是耗时最长的一个过程，这一过程不仅要求洞悉整个数据集结构分布，还要探查每一个特征属性细节情况，并作出应对处理，使数据以最适合的状态传输给模型。针对预处理操作，sklearn中提供了许多模块工具，灵活使用工具可以让数据预处理轻松很多。本文简要介绍数据预处理中的一些主要方法，并结合sklearn中提供的模块进行实践。阅读全文

posted @ 2019-12-17 07:51 奥辰阅读(2073) 评论(0) 推荐(2)

TensorFlow2.0（8）：误差计算——损失函数总结

摘要：本文总结TensorFlow2.0中均方差损失函数和交叉熵损失函数。阅读全文

posted @ 2019-10-23 16:48 奥辰阅读(5130) 评论(0) 推荐(0)

TensorFlow2.0（7）：激活函数

摘要：激活函数是深度学习，亦或者说人工神经网络中一个十分重要的组成部分，它可以对神经元的接收信息进行非线性变换，将变换后的信息输出到下一层神经元。阅读全文

posted @ 2019-10-21 08:03 奥辰阅读(2905) 评论(0) 推荐(0)

TensorFlow2.0（6）：数据预处理中的Dataset

摘要：在整个机器学习过程中，除了训练模型外，应该就属数据预处理过程消耗的精力最多，数据预处理过程需要完成的任务包括数据读取、过滤、转换等等。为了将用户从繁杂的预处理操作中解放处理，更多地将精力放在算法建模上，TensorFlow中提供了data模块，这一模块以多种方式提供了数据读取、数据处理、数据保存等功能。本文重点是data模块中的Dataset对象。阅读全文

posted @ 2019-10-14 08:13 奥辰阅读(16432) 评论(4) 推荐(4)

TensorFlow2.0（5）：张量限幅

摘要：总结TensorFlow2.0中实现张量限幅功能的多个api，包括 maxmium()、minmium()、clip_by_value()、relu()、cli_by_norm()、clip_by_global_norm() 阅读全文

posted @ 2019-10-08 22:02 奥辰阅读(1444) 评论(0) 推荐(1)

TensorFlow2.0（4）：填充与复制

摘要：总结TensorFlow2.0中几个填充复制功能的api。阅读全文

posted @ 2019-10-07 16:54 奥辰阅读(4619) 评论(0) 推荐(1)

TensorFlow2.0（3）：排序及最大、最小、平均值

摘要：总结TensorFlow2.0中排序，求最大值、最小值、平均值等方法，涉及sort()、argsort()、reduce_min()、reduce_max()、redece_mean()、argmin()、argmax()等方法。阅读全文

posted @ 2019-10-02 16:22 奥辰阅读(5451) 评论(0) 推荐(0)

TensorFlow2.0（2）：数学运算

摘要：TensorFlow2.0张量数学运算，包括加（+）、减（-）、点乘（*）、除（/）、地板除法（//）、取余（%）、指数运算、对数运算、矩阵相乘、范数等。阅读全文

posted @ 2019-09-26 20:33 奥辰阅读(4707) 评论(1) 推荐(3)

TensorFlow2.0（1）：基本数据结构——张量

摘要：TensorFlow2.0版本已经发布，虽然不是正式版，但预览版都发布了，正式版还会远吗？相比于1.X，2.0版的TensorFlow修改的不是一点半点，这些修改极大的弥补了1.X版本的反人类设计，提升了框架的整体易用性，绝对好评！赶紧来学习一波吧，做最先吃螃蟹的那一批人！先从TensorFlow的基本数据结构——张量（tensor）开始。阅读全文

posted @ 2019-09-21 10:29 奥辰阅读(6150) 评论(2) 推荐(3)

Python数据分析之Pandas读写外部数据文件

摘要：数据分析、数据挖掘、可视化是Python的众多强项之一，但无论是这几项中的哪一项都必须以数据作为基础，数据通常都存储在外部文件中，例如txt、csv、excel、数据库。本篇中，我们来捋一捋Python中那些外部数据文件读取、写入的常用方法阅读全文

posted @ 2019-09-06 17:31 奥辰阅读(9102) 评论(0) 推荐(3)

Python数据分析之pandas基本数据结构：Series、DataFrame

摘要：本文大致介绍了Pandas中的两种重要数据结构Series数组对象和DataFrame数组对象的特点、主要创建方法、属性。对于从数组对象中进行切片、索引数据的方法阅读全文

posted @ 2019-08-30 17:05 奥辰阅读(7345) 评论(0) 推荐(0)

Python数据分析之numpy数组全解析

摘要：本文是作为Python数据分析入门系列博客，详细介绍了numpy最基本、最常用、最重要的数据结构——ndarray数组的使用。阅读全文

posted @ 2019-08-26 15:31 奥辰阅读(13850) 评论(0) 推荐(6)

Python装饰器完全解读

摘要：装饰器（Decorators）可能是Python中最难掌握的概念之一了，也是最具Pythonic特色的技巧，深入理解并应用装饰器，你会更加感慨——人生苦短，我用Python。阅读全文

posted @ 2019-08-17 17:08 奥辰阅读(3307) 评论(2) 推荐(6)

从源码看Flask框架配置管理

摘要：本文结合对Flask源码的分析总结分析了Flask配置管理的使用方法。Flask通过Config配置类中的6个方法，对应得提供了6种配管管理方式。本文通过代码实例演示每种方式的使用方法，还深度剖析了源码，总结思路，相信你不进可以知其然还可以知其所以然。阅读全文

posted @ 2019-08-13 16:37 奥辰阅读(1212) 评论(0) 推荐(1)

为什么for循环可以遍历list：Python中迭代器与生成器

摘要：只要你学了Python语言，就不会不知道for循环，也肯定用for循环来遍历一个列表（list)，那为什么for循环可以遍历list，而不能遍历int类型对象呢？怎么让一个自定义的对象可遍历？这篇博客中，我们来一起探索一下这个问题，在这个过程中，我们会介绍到迭代器、可迭代对象、生成器，更进一步的，我们会详细介绍他们的原理、异同。阅读全文

posted @ 2019-08-02 15:27 奥辰阅读(7499) 评论(6) 推荐(17)

pymysql指南

摘要：pymysql是Python操作mysql的最主要方法，本文详细介绍pymysql的建库、建表和增删改查操作。阅读全文

posted @ 2019-07-24 22:04 奥辰阅读(4581) 评论(0) 推荐(3)

机器学习回顾篇（3）：线性回归

摘要：线性回归算法应该是大多数人机器学习之路上的第一站，因为线性回归算法原理简单清晰，但却囊括了拟合、优化等等经典的机器学习思想。本篇详细介绍了线性回归算法的原理，并在最后使用代码实现了线性回归算法。阅读全文

posted @ 2019-07-21 21:00 奥辰阅读(1772) 评论(0) 推荐(0)

网络爬虫之使用pyppeteer替代selenium完美绕过webdriver检测

摘要：当使用selenium+webdriver写爬虫被检测到时，pyppeteer是你得不二选择，几乎所有能在人工操作浏览器进行的操作通过pyppeteer都能实现，且能完美避开官方对webdriver的检测。阅读全文

posted @ 2019-06-08 08:25 奥辰阅读(19615) 评论(4) 推荐(4)

网络爬虫之记一次js逆向解密经历

摘要：本文记录了一次某主流电商平台网络爬虫js逆向解密经历。阅读全文

posted @ 2019-05-29 20:43 奥辰阅读(13142) 评论(5) 推荐(4)

scrapy-redis源码解读之发送POST请求

摘要：scrapy-redis是对scrapy改进，在分布式爬虫开发上有卓越的表现，但由于scrapy-redis只从redis中读取起始url，导致发送POST困难，本文从源码出发，逐步探寻、解释scrapy-redis实例化request对象流程，并通过美团爬虫实例演示scrapy-redis框架发送POST请求方法。阅读全文

posted @ 2019-05-15 07:32 奥辰阅读(2921) 评论(0) 推荐(0)

奥辰

莫道君行早，更有早行人。

随笔分类 - python

公告