随笔列表第2页 - AIData

2018年12月14日

摘要： 1、互联网用户数量中国互联网络信息中心（CNNIC）2018.8.20日发布第42次《中国互联网络发展状况统计报告》显示：截止2018年6月30日，我国网民规模达8.02亿，普及率为57.7%。其中，手机网民规模达7.88亿，网民通过手机接入互联网的比例高达98.3%。我国是互联网用户最多的国家。阅读全文

posted @ 2018-12-14 15:45 AIData 阅读(546) 评论(0) 推荐(0) 编辑

2018年12月8日

怎么用Python写爬虫抓取网页数据

摘要：机器学习首先面临的一个问题就是准备数据，数据的来源大概有这么几种：公司积累数据，购买，交换，政府机构及企业公开的数据，通过爬虫从网上抓取。本篇介绍怎么写一个爬虫从网上抓取公开的数据。很多语言都可以写爬虫，但是不同语言的难易程度不同，Python作为一种解释型的胶水语言，上手简单、入门容易，标准库齐阅读全文

posted @ 2018-12-08 11:04 AIData 阅读(59767) 评论(2) 推荐(0) 编辑

2018年12月6日

深度学习模型训练之偏差与方差

摘要：此篇 TensorFlow简要教程及线性回归算法示例介绍了使用TensorFlow进行机器学习的基本流程，此篇介绍一个快速确定神经网络模型中各层矩阵维度的方法介绍了在设计神经网络的时候怎么确定各层矩阵的维度(矩阵的行数与列数)，接下来就可以开始训练模型了，在训练模型的过程中，怎么衡量模型的好坏阅读全文

posted @ 2018-12-06 16:29 AIData 阅读(2466) 评论(0) 推荐(1) 编辑

2018年12月5日

介绍一个快速确定神经网络模型中各层矩阵维度的方法

摘要：深度学习在设计神经网络结构时需要指定每个隐藏层权重矩阵、偏置项的维度，有的时候容易搞混淆，导致运行时产生维度不对的错误，特别是对于隐藏层既深又宽的网络，更容易出错。下面以一个实例来说明怎么简单快速确定每一层各个矩阵的维度。假设需要拟合的函数为：y=f(x)=WX+b。损失函数：J(W,b) 其中阅读全文

posted @ 2018-12-05 13:03 AIData 阅读(7916) 评论(0) 推荐(0) 编辑

2018年12月4日

TensorFlow简要教程及线性回归算法示例

摘要： TensorFlow是谷歌推出的深度学习平台，目前在各大深度学习平台中使用的最广泛。一、安装命令 pip3 install -U tensorflow --default-timeout=1800 -i https://mirrors.ustc.edu.cn/pypi/web/simple 上面是阅读全文

posted @ 2018-12-04 12:52 AIData 阅读(2045) 评论(0) 推荐(0) 编辑

2018年12月3日

Web项目开发中常见安全问题及防范

摘要：计算机程序主要就是输入数据经过处理之后输出结果，安全问题由此产生，凡是有输入的地方都可能带来安全风险。根据输入的数据类型，Web应用主要有数值型、字符型、文件型。要消除风险就要对输入的数据进行检查，对于Web应用来说，检查的位置主要是前端和后端。前端检查只能防止正常状况，没法防止通过工具、程序阅读全文

posted @ 2018-12-03 11:57 AIData 阅读(8987) 评论(0) 推荐(3) 编辑

2018年12月2日

时序数据库及应用场景简介

摘要：时间序列数据库简称时序数据库(Time Series Database)，用于处理带时间标签(按照时间的顺序变化，即时间序列化)的数据，带时间标签的数据也称为时间序列数据。时序数据的几个特点 1. 基本上都是插入，没有更新的需求。 2. 数据基本上都有时间属性，随着时间的推移不断产生新的数据。 3 阅读全文

posted @ 2018-12-02 10:20 AIData 阅读(8838) 评论(0) 推荐(0) 编辑

2018年12月1日

互联网产品怎么做数据埋点

摘要：在互联网产品上线之后，产品和运营人员需要即时了解产品的使用情况，有多少用户，用户使用了哪些功能，停留时长，使用路径。。。等。要回答这些问题，需要有数据，不能拍脑袋想当然。数据怎么得到呢？埋点就是采集数据的重要途径。数据埋点不是新名词，在电脑网站出来之后就有统计工具，站长们很熟悉的谷歌、百度统计等工阅读全文

posted @ 2018-12-01 19:16 AIData 阅读(1272) 评论(2) 推荐(0) 编辑

2018年11月30日

简述分布式跟踪系统实现原理

摘要：问题来源互联网项目通常都是大用户量，大并发，因此从技术架构上大多采用分布式架构构建成大型分布式系统，SOA或者是微服务，一个请求涉及到多个子系统，如果某个请求的处理不正常，怎么排查定位问题呢？如果没有合适的手段，排查问题无异大海捞针，为了提高解决问题的效率，迫切需要有一个技术手段能跟踪整个处理环节阅读全文

posted @ 2018-11-30 22:44 AIData 阅读(928) 评论(2) 推荐(0) 编辑

AIData

公告