09 2017 档案
计算机科学基本概念
摘要:1. 流式(Streaming)文件流(IO streaming)流媒体(Streaming media) 流式传输是实现流媒体的关键技术。所谓流媒体是指采用流式传输的方式在 Internet 播放的媒体格式。 流媒体又叫流式媒体,它是指商家用一个视频传送服务器把节目...
阅读全文
Python web —— Selenium 库
摘要:Selenium:硒,一种化学元素。Selenium 是 Python 下第三方浏览器自动化工具。1. Firefox/Chromefrom selenium import webdriverbrowser = webdriver.Firefox() ...
阅读全文
python中yield用法
摘要:yield在函数中的功能类似于return,不同的是yield每次返回结果之后函数并没有退出,而是每次遇到yield关键字后返回相应结果,并保留函数当前的运行状态,等待下一次的调用。如果一个函数需要多次循环执行一个动作,并且每次执行的结果都是需要的,这种场景很适合使...
阅读全文
ubuntu下tesseract 4.0安装及参数使用
摘要:tesseract是一个开源的OCR引擎,最初是由惠普公司开发用来作为其平板扫描仪的OCR引擎,2005年惠普将其开源出来,之后google接手负责维护。目前稳定的版本是3.0。4.0版本加入了基于LSTM的神经网络技术,中文字符识别准确率有所提高。ubuntu下...
阅读全文
Linux 命令行命令及参数辨异
摘要:1. 软链接与硬链接ln -s 源文件 目标文件当我们需要在不同的目录,用到相同的文件时,我们不需要在每一个需要的目录下都放一个必须相同的文件,我们只要在某个固定的目录,放上该文件,然后在其它的目录下用 ln 命令链接(link)它就可以,不必重复的占用磁盘空间。例如...
阅读全文
一题多解 —— linux 日志文件(log)reload 重新载入
摘要:1. tail -F等同于–follow=name –retry,根据文件名进行追踪,并保持重试,即该文件被删除或改名后,如果再次创建相同的文件名,会继续追踪 也即可以间接实现从日志文件末尾,不断载入显示的过程;2. vim命令模式下::e :e!:重新载入,忽略已...
阅读全文
python中list用法及遍历删除元素
摘要:列表(list)是python的基本数据结构,list中每一个元素都分配一个位置索引,可以通过索引访问元素值,list不要求数据项有相同的数据类型。list初始化list由一个方括号加内部由逗号分割出的不同数据项组成,初始化:list1 = [1,2,3]list2 ...
阅读全文
计算机科学 —— 时间戳(timestamp)
摘要:时间戳的一个重要属性即是:唯一性,以起到唯一标识的作用;1. linux 命令行$ date +%s15062227452. Python 时间戳内置 time 库>> time.time()1506223285.6214163>> int(time.time())1...
阅读全文
ubuntu中使用apt-get安装zbar
摘要:apt-get是linux中常用的shell命令,适用于deb包管理式的操作系统,主要用于自动从互联网的软件仓库中搜索、安装、升级、卸载软件或操作系统。apt-get命令一般需要root权限执行,所以前边一般跟着sudo命令。Zbar是一个开源的二维码(包括条形码)解...
阅读全文
Linux下使用pip安装keras
摘要:Keras是一个底层使用Theano或TensorFlow的深度学习框架,它的设计参考了Torch,用Python语言编写,也很方便使用Python调用,是一个高度模块化的神经网络库,支持使用GPU和CPU。pip是一个安装和管理Python包的工具。在Pip的帮助下...
阅读全文
测试 —— 与开发双手互搏的艺术
摘要:黑盒测试、白盒测试 白盒测试,内部可见,覆盖所有分支、流程,如果分支不会走到,又为什么要开发设计这样的流程分支,白盒测试与开发是一种逻辑必然关系,也即如果未经过白盒测试,分支、流程未全部走过,分支、流程的设计便不合逻辑;
阅读全文
一把把事情做对
摘要:一把把事情做对,不在乎事情的成功与否本身,恰在于做事的态度。如果人非圣贤孰能无过,何况圣贤也会犯错。如何更大程度的降低风险呢?这就是风险规避意识; 多重保障;多重保障的手段也有很多: 反复检查;流程掌控;端到端验证;万无一失的保障方案: A、B 双套方案并行,构成一种...
阅读全文
python中optparse模块用法
摘要:optparse模块主要用来为脚本传递命令参数,采用预先定义好的选项来解析命令行参数。首先需要引入optparser模块,然后执行初始化,实例化一个OptionParser对象(可以带参,也可以不带参数),再为命令行添加选项,示例:from optparse impo...
阅读全文
python批量读取txt文件为DataFrame
摘要:我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作。比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢?首先我们要用到glob模块,这个python内置的模块可以说是非常的好用...
阅读全文
电阻、电感与容抗
摘要:0. 电容PCB设计之电容篇 电容是导体的一种物理特性。给导体加电位,导体就带上电荷,如下图 (a) 所示(在两块平行的金属板之间插入绝缘介质,且引出电极就成为了电容器)。但对于相同的电位,导体容纳电荷的数量却因它本身结构的不同而不同。导体能够容纳电荷的能力称为电...
阅读全文
Python里的一些注释规范
摘要:写代码注释是一件很重要的事情,如果你写的一段函数给别人调用那么往往都需要配上一些基本的注释。写好代码可以让别人容易阅读你的代码。试想一 下:如果你在github上面找到一段你想要的代码,这段代码有200行,可能这些代码我们要进行改造,那么这时候如果代码中都没有恰当的注...
阅读全文
爬虫实战(1)——爬取校内网招聘信息的名称
摘要:最近焦虑感比较强,在思考自己以后从事的工作,与其凭空思考,不如来看点实际的数据,于是爬取了校内网的招聘信息研究下。 编写爬虫之前,我们需要先思考爬虫需要干什么、目标网站有什么特点,以及根据目标网站的数据量和数据特点选择合适的架构。编写爬虫之前,推荐使用C...
阅读全文
python中的异常处理try/except/finally/raise
摘要:异常发生在程序执行的过程中,如果python无法正常处理程序就会发生异常,导致整个程序终止执行,python中使用try/except语句可以捕获异常。try/except异常的种类有很多,在不确定可能发生的异常类型时可以使用Exception捕获所有异常:try: ...
阅读全文
MySQL 优化之 EXPLAIN 关键字
摘要:MySQL查询优化之explain的深入解析0. 准备首先执行如下的 sql 语句:CREATE TABLE IF NOT EXISTS `article` (`id` int(10) unsigned NOT NULL AUTO_INCREMENT,`author_...
阅读全文
命令行 sql 将结果导出到文件
摘要:1. into outfile filename;Mysql查询结果导出为Excel的几种方法mysql> use world; # 使用 mysql 自带的 world 数据库mysql> select * from country into outfile "...
阅读全文
开发环境搭建
摘要:1. Java WebTomcat:双击 tomcat9w.exe 时弹出提示:“指定的服务未安装”进入 tomcat 本地安装目录所在的 bin 文件夹下,命令行界面下,输入并运行如下命令:D:\apache-tomcat-9.0.0.M26\bin>service...
阅读全文
C/C++ 编译器优化
摘要:0. gcc -o gcc -o 的优化仍然是机械的,想当然的。只有做到深入理解计算机系统,加深对编程语言的理解,才能写出最优化的代码。Linux下gcc 优化等级的介绍 gcc -o0 ⇒ 不提供任何优化;gcc -o1 ⇒ 最基本的优化,主要对代码的分支、表达式...
阅读全文
C++ 多线程与并发
摘要:1. 非原子操作 这些非原子操作在被编译为汇编代码后不止一条指令。自加、自减少;new 关键字;申请内存;调用构造函数;pInst = new T;// 对于这样一个赋值语句,更是包含了如下:// 1. 申请内存空间;// 2. 在内存的位置上调用构造函数;// 3...
阅读全文
三网 —— 计算机网络、电信网络、广播电视网络(移动网络)
摘要:网络是一个很大的概念,三网融合所谓的三网分别是:电信网络广播电视网络计算机网络(也叫互联网) 还包括移动端的cellular network,蜂窝网络;1. 移动网络也叫 cellular network,蜂窝网络,其网络架构、基本组件及功能如下: cell:小区,...
阅读全文
plink 与 ssh 远程登录问题
摘要:plink 是一种 putty-tools,ubuntu 环境下,如果没有安装 plink,可通过如下方法进行安装:$ echo y | sudo apt-get install plink1. 解决ssh第一次登录需要交互确认的问题解决SSH第一次登录需要交互确认的...
阅读全文
常见反函数、反函数导数(微分)公式
摘要:0. 反函数基本认识互为反函数之反函数的相互性:g(x) 是 f(x) 的反函数,则 f(x) 也是 g(x) 的反函数; f(g(x))=x, g(f(x))=x1. 反函数导数公式MORE RULES FOR DERIVATIVES如果函数 g(x) 是 f(x)...
阅读全文
三角函数补充(反三角函数与 sec)
摘要:1. sec=1cosSecant (sec) - Trigonometry function secx=HA
阅读全文
Python之Split函数
摘要:python中的split()函数用来拆分一个字符串,通过指定的分隔符对字符串进行切割,返回切割后的字符串列表list。split()函数用法:str.split(str=' ',num = string.count(str))参数str表示分隔符,默认值为空格,但是...
阅读全文
物种起源与进化学说
摘要:小猎犬号上追随达尔文。1. 达尔文进化论理论渊薮拉马克:法国生物学家拉马克提出,在《动物的哲学》中系统地阐述了他的进化学说(被后人称为“拉马克学说”),提出了两个法则:一个是用进废退(use and disuse theory);一个是获得性遗传。用进废退(use...
阅读全文
ubuntu中pytesseract 安装与使用示例
摘要:1. 安装 tesseract-ocr 包安装方法: sudo apt-get install tesseract-ocr2. 安装 PILPIL(python imaging library)是python中的图像处理库安装方法: sudo apt-get inst...
阅读全文
在ubuntu中搜索文件或文件夹的方法
摘要:1. whereis+文件名用于程序名的搜索,搜索结果只限于二进制文件(参数-b)、man说明文件(参数-m)和源代码文件(参数-s),如果省略参数,则返回所有信息。2. find / -name +文件名find是在指定的目录下遍历查找,如果目录使用 / 则表示在所...
阅读全文
优化VMware提高虚拟机运行速度的技巧
摘要:vmware虚拟机如何设置不当的话会造成运行速度慢,并影响主机运行,甚至会出现死机。以下是提高vmware虚拟机运行速度的几个技巧:文章来自:http://blog.csdn.net/shanzhizi1 修改preference中的选项(全局设置)a ...
阅读全文
区块链与密码学
摘要:1. 基本概念数字签名(digital signature):在待发送的信息后面加上另一段内容,作为发送者的证明,且还可用来证明信息未被篡改;公钥私钥: 公钥就像银行的账户(不必隐藏,外界可见),私钥则像是该账户的密码或者账本所有者的签名;2. 加密算法ECDSA:E...
阅读全文
在 Ubuntu 16.04 中安装支持 CPU 和 GPU 的 Google TensorFlow 神经网络软件
摘要:TensorFlow 是用于机器学习任务的开源软件。它的创建者 Google 希望提供一个强大的工具以帮助开发者探索和建立基于机器学习的应用,所以他们在去年作为开源项目发布了它。TensorFlow 是一个非常强大的工具,专注于一种称为深层神经网络deep neura...
阅读全文
Ubuntu+anaconda环境里安装opencv
摘要:在Ubuntu的Anaconda环境下安装OpenCV比较方便,直接在终端中输入以下命令:conda install --channel https://conda.anaconda.org/menpo opencv这个方式安装的是OpenCV2.4.11版本,如果要...
阅读全文
python库学习笔记——爬虫常用的BeautifulSoup的介绍
摘要:1. 开启Beautiful Soup 之旅在这里先分享官方文档链接,不过内容是有些多,也不够条理,在此本文章做一下整理方便大家参考。官方文档2. 创建 Beautiful Soup 对象首先必须要导入 bs4 库 ...
阅读全文
Java 并发 —— 读写锁(ReadWriteLock)
摘要:读写锁(ReadWriteLock),顾名思义,就是在读写某文件时,对该文件上锁。1. ReentrantReadWriteLock三部曲: 加锁;读写操作;解锁;(为保证解锁操作一定执行,通常将其置于 finally 代码段内)2. 将读写锁应用于集合类上使得集合线...
阅读全文
pandas 学习 —— 逻辑表达式与布尔索引
摘要:>> df = pd.DataFrame(np.random.randint(0, 10, (5, 4)), columns=list('ABCD')) A B C D0 0 4 8 41 0 7 7 12 0 6 1 63 1 ...
阅读全文
【繁琐工作自动化】pandas 处理 excel 文件
摘要:0. 一般处理读取 excel 格式文件:df = pd.read_excel(‘xx.xlsx’),下面是一些简单查看文件内容的函数: df.head():展示前五行;df.columns:展示所有的列名,也即属性名;简单统计处理:求某列元素的最大最小平均值,最大最...
阅读全文
Java 内存管理、JVM 工作原理与 Java 运行时系统
摘要:Java 虚拟机规范中说明:所有的对象实例(all class instances)以及数组都要在堆上分配; the heap is the runtime data area from which memory for all class instances and...
阅读全文
Serializable 接口与 Java 序列化与反序列化
摘要:0. 序列化的意义 从内存到本地即为本地化或者在网络中进行传输,或叫序列化,持久化。某 Java 类实现 Serializable 接口的目的是为了可持久化(简单理解为本地化),比如网络传输或本地存储,为系统的分布式运行和异构部署提供先决支持条件。若没有序列化,我们...
阅读全文
安装tensorflow的最简单方法(Ubuntu 16.04 && CentOS)
摘要:先说点题外话:在用anaconda安装很多次tensorflow失败之后,我放弃了,如果你遇到这样的问题:Traceback (most recent call last)…如果不是因为pip版本,就放弃吧.并不是真的放弃,暂时解决不了先放,等了解的多一些,或许问题就...
阅读全文
Eclipse 插件管理
摘要:查看已安装的插件: 【help】⇒ 【About Eclipse】⇒ 【Installed Softwares】1. 常用插件maven:安装步骤如下:【help】⇒ 【Install new software】【work with】⇒ Add 按钮,会弹出 Add ...
阅读全文
settings.xml 文件配置
摘要:Maven 远程中央仓库:repo1.maven.org 通过 ping repo1.maven.org 查看该网络是否可以连接访问;1. 设置代理Plugin org.apache.maven.plugins:maven-clean-plugin:2.5 or on...
阅读全文
Spring MVC 起步
摘要:Spring 通常用来开发 web 应用。1. Spring MVC 的请求响应机制Spring 框架会将请求(request)在调度Servlet(DispatcherServlet)、处理器映射(HandlerMapping)、控制器(Controller)以及视...
阅读全文
机器学习: KNN--python
摘要:今天介绍机器学习中比较常见的一种分类算法,K-NN,NN 就是 Nearest Neighbors, 也就是最近邻的意思,这是一种有监督的分类算法,给定一个 test sample, 计算这个 test sample 与 training set 里每个 train...
阅读全文
Python: PS 图像调整--亮度调整
摘要:本文用 Python 实现 PS 图像调整中的亮度调整,具体的算法原理和效果可以参考之前的博客:http://blog.csdn.net/matrix_space/article/details/22991683import matplotlib.pyplot as ...
阅读全文
SecureCRT连接(内网和外网)虚拟机中的Linux系统(Ubuntu)
摘要:最近在学习Linux,看了网上很多SecureCRT连接本地虚拟机当中的Linux系统,很多都是需要设置Linux的配置文件,有点繁琐,所以自己就摸索了一下,把相关操作贴出来分享一下。 SecureCRT是一款支持SSH(SSH1和SSH2)的终端仿真程序,简单地说...
阅读全文
计算机设计思想 —— 代理(proxy)
摘要:0. 理解两个说着不同母语国家的人想要交流通话,各人说着各自的母语显然是无法沟通的,此时需要一个翻译,一个媒介(medium)、中介,或者一个代理(proxy),比如通用的国际语言英语,比如全世界人民都能懂的表情、手势等肢体语言;1. 面向对象的代理代理类封装了目标类...
阅读全文
AOP 基本术语及其在 Spring 中的实现
摘要:无论是 Spring 还是其他支持 AOP(Aspect Oriented Programming)的框架,尤其是 Spring 这种基于 Java(彻底的面向对象)的语言,在实现 AOP 时,首先为 AOP 这一编程思想,定义一些基本概念,基本术语,基本流程。1. ...
阅读全文
解耦与分离 —— 面向切面编程(AOP)
摘要:家里的电表总结起来有两大特性:电视机需要(电量管理),空调需要(电量管理),热水器也需要电量管理,即一组对象都需要某一功能特性;电视机根据信号输出画面,空调吹出冷风,热水器将水加热,这些业务功能的实现,又是和电表无关的;软件系统中的某些功能,就像家庭中的电表一样。这些...
阅读全文
踏雪寻梅 —— 日志打印
摘要:日志要清晰、便于理解;日志级别;日志打印所在的类、方法位置(调用点),日志打印的时间;1. 经典使用日志的场景对于服务器等一般长时间运行的应用程序,每一步操作(成功或失败),都要输出相关日志; 这样当服务器运行出现问题时,方便定位问题;确认系统运行是否正常;2. 常用...
阅读全文
python库学习笔记——BeautifulSoup处理子标签、后代标签、兄弟标签和父标签
摘要:首先,我们来看一个简单的网页https://www.pythonscraping.com/pages/page3.html,打开后:右键“检查”(谷歌浏览器)查看元素:用导航树的形式简单表示出来:可知:tr是table的子标签tr、th、td、img、span标签都是...
阅读全文
计算机设计思想 —— 解耦(分离)与内聚
摘要:分离、解耦是模块化的基础。概念、功能上的辨异,又是实现分离、解耦的法门。模块间通信:接口; 模块间绝非各自为营,独立作战;业务与管理的分离; 数据与控制的分离; 用户面,信令面;数据链路,控制链路逻辑与视图分离逻辑是功能性代码,视图是内容,展示性代码;视图为逻辑提...
阅读全文
HTML基础(一)
摘要:什么是HTML?HTML 是用来描述网页的一种语言。HTML 指的是超文本标记语言: HyperText Markup LanguageHTML 不是一种编程语言,而是一种标记语言标记语言是一套标记标签 (markup tag)HTML 使用标记标签来描述网页HTML...
阅读全文
Spring 各种注解(@)的含义与认识
摘要:依赖注入,从字面上理解,即是:以注入的方式实现依赖;Spring 容器负责创建应用程序中的 bean,并通过 DI(依赖注入)来协调这些对象之间的关系。当描述 bean 如何进行装配(autowired)时,Spring 具有强大的灵活性,提供了以下三种主要的装配...
阅读全文
Linux 下的静态(函数)库、动态(函数)库
摘要:0. 基本在命名上,静态库的名字一般是 libxxx.a,动态库的名字一般是 libxxx.so,有时 libxxx.so.major.minor,xxx 是该 lib 的名字,major 是主版本号,minor是副版本号。linux 系统存放函数库的目录:/lib(...
阅读全文
卷积神经网络的概念入门
摘要:最近在机器之心上看到一篇介绍卷积神经网络的文章,非常的直白移动,很有收获,做了以下的整理,也方便自己对cnn的了解1. 机器如何看图?简单来说,每个图像都是一系列特定排序的图点(像素)。如果你改变像素的顺序或颜色,图像也随之改变。举个例子,存储并读取一张上面写着数字 ...
阅读全文
SELinux 初探
摘要:SELinux:Security Enhanced Linux。SELinux 是 NSA(美国国家安全局)开发设计,整合到 Linux 内核中的一个模块。0. 基本概念DAC(Discretionary Access Control),自主访问控制,传统的文件权...
阅读全文
认识虚拟化(virtualization)
摘要:0. 基本定义虚拟化的本质是将现有的计算机资源通过虚拟化的技术分割成若干个计算机资源,这些计算机资源互相独立;其最终目标是提高计算机的利用效率以最大化计算机的灵活性; 虚拟化为数据、计算能力、存储资源以及其他资源提供的是一种逻辑视图(以逻辑抽象的形式进行展现),而非物...
阅读全文
Python: PS 滤镜--马赛克
摘要:本文利用 Python 实现PS 滤镜中的马赛克效果,具体的算法原理和效果可以参考之前的博客:http://blog.csdn.net/matrix_space/article/details/30469217from skimage import img_as_fl...
阅读全文
Tensorflow学习笔记——占位符和feed_dict(二)
摘要:创建了各种形式的常量和变量后,但TensorFlow 同样还支持占位符。占位符并没有初始值,它只会分配必要的内存。在会话中,占位符可以使用 feed_dict 馈送数据。feed_dict是一个字典,在字典中需要给出每一个用到的占位符的取值。在训练神经网络时需要每次提...
阅读全文
Tensorflow学习笔记——张量、图、常量、变量(一)
摘要:1 张量和图TensorFlow是一种采用数据流图(data flow graphs),用于数值计算的开源软件库。其中 Tensor 代表传递的数据为张量(多维数组),Flow 代表使用计算图进行运算。数据流图用「结点」(nodes)和「边」(edges)组成的有向图...
阅读全文
IDEA 单元测试
摘要:下载所需的两个 jar 包,下载地址:Download and Install · junit-team/junit4 Wiki · GitHub junit-4.12.jarhamcrest-core-1.3.jar打开 IDEA,创建 Java 工程;通过 Lib...
阅读全文
sublime —— 强大的插件
摘要:1. 代码自动补全与智能提示: All Autocomplete:Sublime Text 默认的 Autocomplete 功能只考虑当前的文件,而 All Autocomplete 插件会搜索所有打开的文件来寻找匹配的提示词。SublimeCodeIntel:支持...
阅读全文