随笔分类 - 随笔记
摘要:R语言 R语言是动态语言 环境搭建 先安装R再安装Rstudio,注意要保证: + R语言安装指定为64位; + R语言和Rstudio的安装路径不要有汉字; + R语言和Rstudio的安装父目录要为同一个。 R对象和函数 + R对象可以看作是具有关联名称的存储空间。R中的一切都存储在对象中。所有
阅读全文
摘要:mongodb NoSQL简介 NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL",指的是非关系型的数据库 + 代表着不仅仅是SQL 没有声明性查询语言 没有预定义的模式 键 值对存储,列存储,文档存储,图形数据库 最终一致性,而非ACID属性 非结构化和不可预知的数据
阅读全文
摘要:mysql数据库 1. 安装 1. 安装mysqldb 2. pip install sqlalchemy 2. 连接 其中,echo为True代表打开logging,test为数据库名。 3. 创建映射 一个映射对应着一个Python类,用来表示一个表的结构。下面创建一个person表,包括id和
阅读全文
摘要:ceph + ceph是一个分布式存储系统 + Ceph提供了三种存储类型:块存储、文件存储和对象存储,本文主要介绍对象存储的RGW基本原理和应用场景。 CRUSH算法 + 一般的分布式系统都会采用一个或者多个中心服务用来控制数据的分布,这种机制使得每次IO操作都会先去一个地方查询数据在集群中的元数
阅读全文
摘要:decode()和encode() encode()和decode()都是字符串的函数,分别指编码和解码,在python中,Unicode类型是作为编码的基础类型,如下: 即: str.decode()是指其他编码方式解码为unicode码, str.encode(‘qita’)unicode码编为
阅读全文
摘要:mysql数据库 1. 安装 1. 安装mysqldb 2. pip install sqlalchemy 2. 连接 其中,echo为True代表打开logging,test为数据库名。 3. 创建映射 一个映射对应着一个Python类,用来表示一个表的结构。下面创建一个person表,包括id和
阅读全文
摘要:ocr之splitLine()函数 + 该函数的功能是为实现对每行的文字分段而设计的。流程如下: 一. 针对时间格式,提前取出来 + 该函数是针对每行的文本lineText中的时间格式,提前取出来 + 其中,用正则表达式匹配,匹配到各种时间格式就标记为 elemList[i]['Delete'] =
阅读全文
摘要:一. JavaScript 用法 + HTML 中的脚本必须位于 与 `` 标签之间。 + 脚本可被放置在 HTML 页面的 和 ``部分中。 标签 + 如需在 HTML 页面中插入 JavaScript,请使用 标签 一. JavaScript 用法 + HTML 中的脚本必须位于 与` `标签之
阅读全文
摘要:http协议(2) HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP,使HTTP客户(如Web浏览器)能够从HTTP服务器(Web服务器)请求信息和服务,当一个客户端向服务器端发出请求,然后Web服务器返回响应(respo
阅读全文
摘要:http 协议(1) 1. HTTP协议的主要特点 + 支持客户/服务器模式。 + 简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
阅读全文
摘要:html ` body 元素的内容会显示在浏览器中。 title 元素的内容会显示在浏览器的标题栏中。 body 元素的内容会显示在浏览器中。 title 元当事人非素的内容会显示在浏览器的标题栏中。 ` 输出 标题 注释 预格式文本 输出为: 地址 `` 缩写 ` etc. WWW 在某些浏览器中
阅读全文
摘要:正则表达式 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。 下图提供了正则表达式的简介写法: 1. 通配符 ?与 + ? 通配符匹配文件名中的 0 个或 1 个字符; + 通配符匹配零个或多个字符。 ps:
阅读全文
摘要:ocr之列切分 当得到每一行的图之后,需要进行列投影切分成单个字符,其实现大体如下: 1. 找出列间隔,根据列间隔的index进行分列 2. 对于列切分后得到的每块小图求h,w,scale: 3. 根据scale进行判断: 3.1 去掉图片、竖线、横线 3.2 如果宽高比过低且高度大于10,或高度过
阅读全文
摘要:浅谈ocr 最近在做一个ocr相关的项目,由于是第一次接触图像切割相关工作,有许多一知半解甚者丝毫没思路无从下手的问题,就边做边摸索边学习,现在总结如下: + 项目总体需求是将一张医疗报告或者发票之类的图片上边的文字进行切割,切割成单个字符,再进行文字识别,同时以json格式返回识别结果和文字的坐标
阅读全文
摘要:函数的参数 默认参数 当函数有多个参数时,把变化大的参数放前面,变化小的参数放后面。变化小的参数就可以作为默认参数。使用默认参数有什么好处? 最大的好处是能降低调用函数的难度。 那么,怎么使用默认参数呢? ==== 举个例子,我们写个一年级小学生注册的函数,需要传入name和gender两个参数:
阅读全文
摘要:Linux学习笔记 最近在学习Linux,感觉还挺有意思的,哈哈。边学边练,下边是接触到的一些常用命令,以备不时之需。 一. linux目录与目录组管理 Linux系统是一个多用户多任务的分时操作系统,任何一个要使用系统资源的用户,都必须首先向系统管理员申请一个账号,然后以这个账号的身份进入系统。
阅读全文
摘要:gcc gcc的基本用法 + c程序用gcc编译,c++程序用g++编译. 1. 创建.c文件 vim main.c 2. 编译与链接 方法一:产生目标文件 写好.c文件之后,执行下边命令: gcc c main.c 生成一个 main.o文件,然后执行如下命令(其中main是给输出文件命的名):
阅读全文
摘要:vim编辑器使用 vim作为最强大的编辑器,在linux系统及unix系统下占有重要地位,是linux系统下标准的编辑器,用起来方便快捷,下边就记录一下一个linux初学者对vim编辑器的学习。 vim三种模式及其相互切换 三种模式 1. 命令模式(默认):可以复制行,删除行等。 2. 输入模式:可
阅读全文
摘要:TortoiseSVN使用方法 我们知道,SVN和Git一样,是代码托管工具,下面就简单介绍一下SVN使用方法。 签入(导入)源代码到SVN服务器 假如我们在本地文件夹svncode中创建了一个项目,我们要把这个项目的源代码签入到SVN Server上的代码库中里,首先右键点击svncode文件夹,
阅读全文
摘要:macdown使用 标题 我们用“ ”,“ ”," "等表示不同级别的标题 分割线 可以在一行中用三个以上的星号、减号、底线来建立一个分隔线,行内不能有其他东西。 代码 用" ”之间存放代码块. 或者每行简单的敲四个空格,也表示代码行,复制代码块的话不建议用这个,因为每行都得空。 例: 换行 按En
阅读全文