亲测可用
只需要浏览器,复制在线文档平台的内容生成文档的技巧。这里的浏览器需要有开发者工具选项,现在一般的浏览器如谷歌、火狐、360浏览器等都自带这个。下面以360安全浏览器为例。
一、以搜索引擎爬虫的身份访问网页
在线文档平台为了让文档内容被搜索引擎收录,一般展示给搜索引擎和普通用户的界面会不一样,展示给搜索引擎的页面是能直接复制的文字。
以某丁的文档页面为例,按f12(或者右键选择“检测”或“审查元素”),打开开发者工具栏。
选择“device toolbar”小按钮,网页界面会缩小,选择上方的“选择设备”列表,第一次使用需要新建一个爬虫身份设备,点“编辑”,添加设备,设备名可以写“google”,useragent里填写为“googleBot”。 新建完成后,选择这个设备,刷新一下页面,页面文档内容区域就会出现文本形式的内容,可以直接复制。
二、以移动手机端的身份访问网页
在线文档平台为了让文档内容适配手机端,一般展示的手机端界面比pc端界面简单很多,这里以某度的文档页面为例。
跟上面步骤一样,按f12打开开发者工具栏,选择“device toolbar”小按钮,在设备列表里选择一个移动端的设备,这里选择“iphone6/7/8”,敲一下地址栏重新访问,文档页面的界面一般会变化,变得简单很多,而且没多少广告。
点击“加载更多”,将所有的文档内容展开。
部分版本的360安全浏览器下,把“device toolbar”小按钮按回,就可以右键全选,文档内容直接可以复制,将内容粘贴到word里了。
收藏了,备用,感谢分享!
方法很不错,
厉害!看看能不能研究出自动抓取的工具。
多谢分享,很有用。另外豆丁这个网站有点恶心。
冰点应该用的是同样的逻辑来完成的下载
一下午干了一件事,开抓包下载了全套微课
@林木木 工程师就是厉害,菜鸟连抓包都不懂