文章 2025-03-26 来自:开发者社区

Python + Chrome 爬虫:如何抓取 AJAX 动态加载数据?

在现代 Web 开发中,AJAX(Asynchronous JavaScript and XML) 技术被广泛应用于动态加载数据,使得网页能够在不刷新的情况下更新内容。然而,这也给传统爬虫带来了挑战——使用 requests + BeautifulSoup 只能获取初始 HTML,而无法捕获 AJAX 返回的动态数据。 解决方案: Selenium + ChromeD...

文章 2023-11-03 来自:开发者社区

Chrome 无法抓取跳转请求的解决办法

用chrome抓取 post 的登录请求时发现,在发出 post 请求之后,页面会跳转,这样就无法在 chrome 的开发人员工具中的 network 面板中查看到请求的具体信息。解决办法:network 勾选Preserve log,这样就可以查看到 post 请求的信息

Chrome 无法抓取跳转请求的解决办法
文章 2022-02-15 来自:开发者社区

selenium 和 phantomJS或chrome浏览器抓取渲染网页

首先pip安装selenium 一、phantomjs 1、下载phantomjs压缩包,解压,把bin文件夹路径加入PATH环境变量 2、代码 #coding=utf-8 import requests import re from pyquery import PyQuery as pq from lxml import etree from bs4 import BeautifulSo...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

智能引擎技术

AI Online Serving,阿里巴巴集团搜推广算法与工程技术的大本营,大数据深度学习时代的创新主场。

+关注