刘硕的技术查阅手册

Python 全栈开发学习笔记

用户喜欢某篇文章,可以给文章作者打赏,鼓励作者写出更多更好的文章来。文章打赏功能,涉及到了第三方支付,这里主要讨论接入支付宝支付的功能。

阅读全文 »

虽然相较于简单查找而言,二分查找能够节省大量的时间。但随着数据量的增多,查找的速度还是会变得很慢。我们希望有一种数据结构,查找数据时总能一下子就定位到我们要找的数据。换句话说,这种数据结构查找数据所需要的时间为 O(1)。数组和链表做不到这一点,散列表可以做到。

阅读全文 »

数据解析,就是把我们所需要的数据从完整的网页中解析出来。数据解析主要用来实现聚焦爬虫。我们知道,网页中显示的数据都是储存在 HTML 的标签或者标签的属性中。所以我们往往也是基于 HTML 的标签对数据进行解析提取。

阅读全文 »

道高一尺,魔高一丈。互联网上的爬虫、反爬与反反爬之间的博弈堪称互联网中的壮举。本文记录集中常见的反爬机制,与响应的反反爬策略,仅供学习交流使用。万不可用来做违法乱纪的勾当。

阅读全文 »

简要说一下关于爬虫的东西。通俗来讲,爬虫就是通过编写程序,模拟我们使用浏览器上网,在互联网中抓取我们想要的数据的过程。

阅读全文 »

对于用户个人,可以通过文集来收集分类整理文章。对于整个网站,作者可以讲文章发布到不同的专题。如果作者是专题管理员,那么可以直接发布;如果作者不是管理员,则需要审核通过后才能发布到专题中。

阅读全文 »
0%