经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » JS/JS库/框架 » Node.js » 查看文章
node.js学习笔记之koa框架和简单爬虫练习
来源:jb51  时间:2018/12/14 9:11:13  对本文有异议

Koa -- 基于 Node.js 平台的下一代 web 开发框架

koa是由 Express 原班人马打造的,致力于成为一个更小、更富有表现力、更健壮的 Web 框架。 使用 koa 编写 web 应用,可以免除重复繁琐的回调函数嵌套, 并极大地提升错误处理的效率。koa 不在内核方法中绑定任何中间件, 它仅仅提供了一个轻量优雅的函数库,使得编写 Web 应用变得得心应手。开发思路和express差不多,最大的特点就是可以避免异步嵌套。koa2利用ES7的async/await特性,极大的解决了我们在做nodejs开发的时候异步给我们带来的烦恼。

英文官网:http://koajs.com

中文官网:http://koajs.cn

1.koa

安装koa包: npm i -S koa@latest
引入: const koa = require("koa");
实例化对象: const app = new koa;

通过实例操作,专门用于客户端请求的函数叫做中间件,使用use()注册

use()函数中必须使用异步 async; use可是调用无数次;

其中有两个参数:

a)ctx: 上下文环境,node的请求和响应对象,其中不建议使用node原生的req和res属性,使用koa封装的requset和response属性

b)next: next(),将本次控制权交给下一个中间件。

最后一个中间件使用next()无意义,执行完控制权返回上一层,直至第一个。

1. next参数的使用demo

  1. const Koa = require("koa");
  2. const koa = new Koa();
  3. //中间件1
  4. koa.use(async (ctx, next) => {
  5. console.log("1 , 接收请求控制权");
  6. await next(); //将控制权传给下一个中间件
  7. console.log("1 , 返回请求控制权");
  8. }); //将中间件注册到koa的实例上
  9.  
  10. //中间件2
  11. koa.use(async (ctx, next) => {
  12. console.log("2 , 接收请求控制权");
  13. await next();
  14. console.log("2 , 返回请求控制权");
  15. });
  16.  
  17. //中间件3
  18. koa.use(async (ctx, next) => {
  19. console.log("3 , 接收请求控制权");
  20. console.log("3 ,返回请求控制权");
  21. });
  22. koa.listen(3000, ()=>{
  23. console.log("开始监听3000端口");
  24. });

注:当中间件中没有next(),不会执行下面的中间件

访问localhost:3000的效果图;

注:会有两次操作是因为图标icon也会请求一次

2.ctx参数的使用demo

  1. const Koa = require("koa");
  2. const koa = new Koa();
  3. koa.use(async (ctx, next)=>{
  4. ctx.body = "body可以返回数据,";
  5. ctx.body += "可以多次调用,";
  6. ctx.body += "不需要end()";
  7. });
  8. koa.listen(3000, ()=>{
  9. console.log("监听开始");
  10. });

效果:

ctx.url ,ctx.path ,ctx.query ,ctx.querystring ,ctx.state ,ctx.type

  1. const Koa = require("koa");
  2. const koa = new Koa();
  3. koa.use(async (ctx, next)=>{
  4. ctx.body = ctx.url;
  5. ctx.body = ctx.path;
  6. ctx.body = ctx.query;
  7. ctx.body = ctx.querystring;
  8. });
  9. koa.listen(3000, ()=>{
  10. console.log("监听开始");
  11. });

访问http://localhost:3000/path?name=sjl&age=18为例,效果图:

1. url: 整个路径

2. path: 非查询部分

3. query: 将查询部分转为JSON对象

4. querystring: 将查询部分转为字符串

5. ctx.state ,ctx.type 表示状态吗和类型

2.简单爬虫练习

安装request,cheerio模块

  1. npm i -S request: 请求模块
  2. npm i -S cheerio: 抓取页面模块(JQ核心)

抓取网页数据案例(随机网页)

  1. //导入模块
  2. const request = require("superagent"); //导入请求模块
  3. const cheerio = require("cheerio");
  4. const {join} = require("path");
  5. const fs = require("fs");
  6.  
  7. let arr = [], //存放数据
  8. reg = /\n|\s+/g, //replace中使用
  9. url = "https://www.shiguangkey.com/course/search?key=%E5%89%8D%E7%AB%AF/";
  10. request
  11. .get(url)
  12. .end((err, res) => {
  13. const $ = cheerio.load(res.text); //把字符串内的标签当成dom来使用
  14. $(".course-item").each((i, v) => {
  15. // v当前进来的dom,根据网页的布局结构来找到准确的dom节点
  16. const obj = {
  17. imgSrc : $(v).find("img").prop("src"),
  18. price : $(v).find(".fr span").text().replace(reg, ""),
  19. total : $(v).find(".item-txt").text().replace(reg, ""),
  20. href : join(url + $(v).find(".cimg").prop("href"))
  21. };
  22. console.log(join(url + $(v).find(".cimg").prop("href"))); //拼接
  23. arr.push(obj); //把对象放进数组里
  24. });
  25. fs.writeFile("./sjl.json", JSON.stringify(arr)); //将爬到的数据写入文档中
  26. });

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持w3xue。

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号