nodeJS从入门到进阶一（基础部分）

一、Node.js基础知识

1、概念

简单的说 Node.js 就是运行在服务端的 JavaScript。
Node.js 是JavaScript的运行环境
Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型，使其轻量又高效。

2、安装使用

官网下载地址：http://nodejs.cn/

nodeJS5个基本对象：

1、require 引入模块
2、export 导出对象
- 语法：
  - export.属性 = 值；
  - export.方法名 = 函数；
- 注意：
  - export时module对象的引用 export == module.export （指向同一个内存空间）
  - export是module.export的引用，不能改指向，只能添加属性和方法
  - module.export才是真正的暴露对象，指向哪里就暴露哪里-----推荐使用
3、module 模块对象
- module.export
  - module.export.属性 = 值
  - module.export.方法名 = 函数
  - module.export = 对象或函数
- module.id 模块id，模块名称
- module.parent 模块父级
- module.filename 模块文件名和路径
- module.children 子模块列表
- module.paths 模块查找路径，如果当前目录找不到
- node_modules就去上一级目录找，直到根目录
4、__filename 当前js文件的绝对路径
5、__dirname 当前js文件所在文件夹绝对路径

npm包管理器（node Package Manager)

package.json是node.js的项目描述文件，以json格式的形式描述项目
创建package.json文件 ----> npm init ------ npm init -y ---->自动全部yes创建
package.json常用属性
- name: 项目名称
- version:版本号
- description:项目描述
- main：主模块
- dependencies：项目依赖
- devDependencies ：开发时依赖
- scripts:脚本命令，可以使用npm命令执行
- license:开源协议
npm常用指令：
- npm install <包的名称> i--->install
- npm i <包的名称>@版本号 //安装指定版本
- npm i <包的名称> -g全局安装 -S(save)写入项目依赖列表 -D(dev)写入开发依赖列表
- npm search <包的名称> //搜索包
- npm view <包的名称> //查看包
- npm uninstall <包的名称> //卸载包
- npm update <包的名称> //更新包

cnpm （淘宝镜像）

npm install -g cnpm --registry=https://registry.npm.taobao.org

nodeJS回调函数

回调函数机制：
- a.定义一个普通函数
- b.将函数作为参数传入另一个函数（调用者）
- c.调用者在执行过程中根据时机和条件决定是否调用函数
回调函数用途：
- 通常用于在达到某个时机或条件时，需要执行代码的情况,使用回调函数

同步和异步

同步：上一行执行完成后，下一行才能得到执行
异步：将比较复杂的任务以任务线程实现，不用等上一句执行完成，下一句也能执行。

异步的三种实现方式:

(1) 回调函数
回调函数不一定是异步（forEacch），异步一定有回调函数
(2) 事件（针对服务器端的事件）
事件源.on('事件名称'，回调函数)

/* 开启一个服务器*/
var http = require('http');
// 建立服务器
var app = http.createServer(function(request, response) {
    response.writeHead(200, {
        "Content-Type": "text/plain"   
    });
    response.end("Hello world!");
});
//启动服务器
app.listen(80,function(){
    console.log('服务器已运行')
})

(3) promise 承诺对象

/*
什么是promise?
    promise是es6中新增的承诺对象，用于对异步的操作进行消息的传递
promise的状态?
    Pending     等待中
    Resolved    成功
    Rejected    失败
    Pending => Resolved
    Pending => Rejected
promise 有什么用？
    promise可以传递异步消息
    由于异步的返回结果时间顺序不可控，所以需要使用promise来统一控制输出结果
*/
var promise = new Promise(function(resove,reject){
    resolve()
})
//调用对象
promise.then(res>{
    //成功的回调
}).catch(err=>{
    //失败的回调
})

//利用promise对象的all方法可以实现手动调整输出顺序，相当于把异步变为同步
Promise.all([p1,p2]).then(datas=>{
    //返回数组
})

二、Buffer缓存区和文件模块

1、Buffer缓存区

概念

在内存中开辟了一个临时区域，用于存放我们需要运算的字节码

创建缓存区

创建指定长度的缓存区

var buf = new Buffer(大小) //创建5个字节的缓存区
buf.write('a') //存入一个字节  转成16进制 的Ascall码的61  在node中默认使用utf-8编码，一个中文3个字节

按指定的数组编码创建缓存区

var buf = new Buffer([十进制编码]) //数字小可以

按指定字符创建缓存区

var buf = new Buffer('字符串')

写入缓存区

buf.write('字符串')

读缓存区

buf.toString()

复制缓存区

buf.copy(buf2)

2、文件模块（fs）

读取文件

由于nodejs是服务端程序，必须要有文件读写操作，在客户端没有这样的功能

文件读写有两种方式：

直接读取：

将硬盘上的所有内容全部读入内存以后才触发回调函数
两种写法：

//异步：定义一个回调函数，接收读取到的内容
    fs.readFile('文件路径',(err,data)=>{})

//同步：几乎所有fs的函数都有同步版本，只需在异步版本后面加Sync即可 （Async：异步）
    fs.readFileSync('文件路径')

流式读取：
- 将数据从硬盘中读取一节就触发回调函数，实现大文件操作

写文件

同步版本:

fs.writeFileSync('文件名'，'数据')

异步版本:

fs.writeFile('文件名'，'数据'，funciton(err){/*写完文件以后执行的代码*/})

读取文件信息

fs.stat('文件名',function(err,state){
    //state时文件信息对象，包含了常用的文件信息
    //size： 文件大小，单位字节
    //mtime: 文件修改时间
    //birthtime 文件创建时间

    //方法
        .isFile() //判断当前查看的对象是不是一个文件
        .isDirectory() //判断是不是一个目录  
})

删除文件

fs.unlink('文件名',function(err){})

需求：填写代码实现删除一个非空目录

fs.rmdir()

fs.readdir()

读取每一个文件夹的详细信息

fs.stat()

判断如果是文件

fs.unlink()

//递归调用自己

fs.rmdir()

演示代码

var fs = require('fs');
var path = require('path');
function rmdir(p){
    //获取文件列表
    var list = fs.readdirSync(p);
    list.forEach((item)=>{
        //拼接路径
        let p1 = path.join(p,item);
        //判断是否为文件
        if(fs.statSync(p1).isFile()){
            fs.unlinkSync(p1);
        }else{
            //递归调用自己
            arguments.callee(p1);
        }
    })
    //删除空文件夹
    fs.rmdirSync(p);
}
rmdir('./data1');

流式读取

流：什么是流
- 所有互联网的数据都是以流的方式，流式一组有起点有终点的数据传输方式

流的操作：

流式读取文件

//可读取数据的流
var fs = require("fs");
var data = '';

// 创建可读流
var readerStream = fs.createReadStream('input.txt');

// 设置编码为 utf8。
readerStream.setEncoding('UTF8');

// 处理流事件 --> data, end, and error
readerStream.on('data', function(chunk) {
data += chunk;
});

readerStream.on('end',function(){
    console.log(data);
});

readerStream.on('error', function(err){
    console.log(err.stack);
});
console.log("程序执行完毕");

以流的方式写文件

//可写入数据的流
var fs = require("fs");
var data = 'hello world';

// 创建一个可以写入的流，写入到文件 output.txt 中
var writerStream = fs.createWriteStream('output.txt');

// 使用 utf8 编码写入数据
writerStream.write(data,'UTF8');

// 标记文件末尾
writerStream.end();

// 处理流事件 --> data, end, and error
writerStream.on('finish', function() {
    console.log("写入完成。");
});

writerStream.on('error', function(err){
    console.log(err.stack);
});

console.log("程序执行完毕");

管道流
管道提供了一个输出流到输入流的机制。通常我们用于从一个流中获取数据并将数据传递到另外一个流中

var fs = require("fs");

// 创建一个可读流
var readerStream = fs.createReadStream('input.txt');

// 创建一个可写流
var writerStream = fs.createWriteStream('output.txt');

// 管道读写操作
// 读取 input.txt 文件内容，并将内容写入到 output.txt 文件中
readerStream.pipe(writerStream);

console.log("程序执行完毕");

链式流

//压缩文件
var fs = require('fs');
var zlib = require('zlib');
// 压缩 input.txt 文件为 input.txt.gz
fs.createReadStream('input.txt')
    .pipe(zlib.createGzip())
    .pipe(fs.createWriteStream('input.txt.gz'))
console.log("文件压缩完成。");

//解压文件
var fs = require("fs");
var zlib = require('zlib');

// 解压 input.txt.gz 文件为 input.txt
fs.createReadStream('input.txt.gz')
.pipe(zlib.createGunzip())
.pipe(fs.createWriteStream('input.txt'));

console.log("文件解压完成。");

三、常用模块与网络爬虫

1、常用模块

path模块

格式化路径

path.nomalize(p)

拼接路径（将多个字符串拼接成一个完整路径）

/*使用path.jon拼接文件路径和 连接符 拼接优点
    1.自动帮我们添加路径分隔符（根据当前操作系统）
    2.自动改正错误的路径分隔符
*/
path.join(path1,path2)
let url = path.join(__dirname,path1); //常用

返回路径中文件夹部分

path.dirname(p)

返回路径中文件部分(文件名和扩展名)

path.basename(p)

返回路径中文件的后缀名

path.extname(p)

返回路径字符串的对象。

path.parse(path)

从对象中返回路径字符串,和parse相反

path.format(path)

url模块

什么是url？
- url是全球统一资源定位符，对网站资源的一种简洁表达式，简称网址
url的构成
- 完整
  协议://用户名:密码@主机名.名.域:端口号/目录名/文件名.扩展名?参数名=参数值&参数名2=参数值2#hash
- 常见
  协议://主机名.名.域/目录名/文件名.扩展名?参数名=参数值&参数名2=参数值2#hash
node.js的url模块
- 在node.js中提供了两套给予url进行处理的API功能
- url模块和（WHATWG URL标准模块）

http模块

http协议
软件开发模式
- 单机模式
- C/S模式 (Client / Server)
- B/S模式 (Brower / Server)

http模块

get方法(用于模仿客户端从服务器获取数据)

    var http = require('http');
    http.get('url',function(res){
        //res 是返回对象，接收到服务器响应的所有内容
        res.on("data",function(a){
            a //以流的方式获取数据 //每节64kb
        })
    })

2、网络爬虫

概念

是一种自动获取网页内容的程序

实现思路

打开网页内容，查看源代码，分析需要获取的内容规律
编写代码，打开网页，获取html源代码
通过正则表达式提出所需要的内容
遍历数据，批量获取所需要的内容
示例代码请点击这里

posted @ 2019-08-27 11:58 smile_or 阅读(1164) 评论(0) 收藏举报

刷新页面返回顶部

小跑追趕幸福

过去被翻阅，瞬间才明白。原来，记忆已经被搁浅

nodeJS从入门到进阶一（基础部分）

一、Node.js基础知识

1、概念

2、安装使用

nodeJS5个基本对象：

npm包管理器（node Package Manager)

cnpm （淘宝镜像）

nodeJS回调函数

同步和异步

二、Buffer缓存区和文件模块

1、Buffer缓存区

概念

创建缓存区

写入缓存区

读缓存区

复制缓存区

2、文件模块（fs）

读取文件

写文件

读取文件信息

删除文件

需求：填写代码实现删除一个非空目录

流式读取

三、常用模块与网络爬虫

1、常用模块

path模块

url模块

http模块

2、网络爬虫

概念

实现思路

公告