零代码编程：用ChatGPT写Python程序爬取并处理网页数据

云烟 • 2023年 10月 12日下午6:00 • 编程

零代码编程：用ChatGPT写Python程序爬取并处理网页数据下面这个网站页面，列出了很多AI网站，但是是以图片方式列出，点击图片会跳转到网站。怎么能把这些AI网站名称、AI网站网址自动爬取下来保存成exc

欢迎大家来到IT世界,在知识的湖畔探索吧!

下面这个网站页面，列出了很多AI网站，但是是以图片方式列出，点击图片会跳转到网站。怎么能把这些AI网站名称、AI网站网址自动爬取下来保存成excel文件呢？

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

首先，在chrome浏览器中点击右键，点击inspect，可以查看到每个图片超链接的网页源代码

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

可以看到，网址在href属性值里面，网站名称在alt属性值里面

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

<div class=”grid-image-wrapper”>

<img width=”800″ loading=”lazy” src=”https://uploads-ssl.webflow.com/63e6b0363b7fbc64fe4ba92c/63f1777cc167269e00510ad4_motion%20white.png” alt=”Motion logo”></div></a>

但是，alt属性值后面多了一个logo，所以获取到这个属性值后要去掉logo这个串字符。

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

然后让ChatGPT写一段代码

复制粘贴到Visual Studio Code中运行，显示程序运行错误，推测应该是Python安装环境的问题

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

于是，安装Anaconda3，创建虚拟环境

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

虚拟环境创建成功了，但是无法激活，显示：

CommandNotFoundError: Your shell has not been properly configured to use ‘conda activate’.

If using ‘conda activate’ from a batch script, change your

invocation to ‘CALL conda.bat activate’.

To initialize your shell, run

$ conda init <SHELL_NAME>。

试了多个方法没成功，最后修改运行终端为command prompt，终于成功。

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

这时候程序没有报错，但是创建excel文件不成功。把出错信息丢给chatgpt，让它找解决办法。

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

尝试了chatgpt推荐的几个方法，没有成功。

放弃，于是让chatgpt不生成excel文件，只输出一个表格。

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

终于成功！

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

但是，有一个问题，我只想要AI相关的网站信息，但是这个程序把web3和其他网站信息都爬取下来了。

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

查看网页源代码，好像没有分成多个网页，所有这些网站都在一个html页面。那就让程序只爬取包含AI网站的div里面内容，修改chatgpt提示词：

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

然后在虚拟环境中跑这个Python程序

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

终于大功告成，爬取到真正想要的数据信息。

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

不过，这些表格信息复制到excel里面就乱了。

再尝试让chatgpt整理这些信息然后写入excel表格：

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

这次运行成功，成功创建如下excel表格，完美的将网页中的信息爬取和整理好了。

零代码编程：用ChatGPT写Python程序爬取并处理网页数据

一些经验总结：

Python编程一定要装Anaconda3，用虚拟环境来运行。很多时候出错，都是环境配置有问题。用虚拟环境可以完美解决这个问题。

多次迭代优化。由于现实中的情况复杂多变，很少情况下程序一次就跑通，要根据每次返回的错误信息去针对性的修改完善。

如果ChatGPT不能一次性完成设定的目标，就分解成两个甚至多个任务，然后一个个的完成。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://itzsg.com/21836.html

chatGPT GPT python 数据

赞 (0)

0

大家talk丨拿高薪的程序员，都学了什么编程语言？

上一篇 2023年 10月 11日上午9:00

ARM Cortex-A 编程手册学习笔记

下一篇 2023年 10月 13日上午10:00

发表回复

下月上线，微软 Teams 会议将支持用户临时修改名称
2天前
分享到:

下月上线，微软 Teams 会议将支持用户临时修改名称p data vmark 7b1c a class s tag href https www ithome com target blank IT 之家 a 1 月 8 日消息科技媒体 mwpro 今天 1 月 8 日发布博文报道称微软计划于 2025 年 2 月在 Microsoft Teams 中推出新功能用户可以在会议期间修改他们的显示名称 strong 这项改动仅限于会议期间不会影响用户个人资料卡片上的原始姓名 strong p p data vmark 055b 用户可以在会议期间临时修改显示名称修改后的名称仅在该会议中生效会议结束后显示名称将恢复为原始名称 IT 之家附上相关截图如下 p p data vmark 4c8c style text align center img src https img ithome com newsuploadfi 2025 1 5f76915d 1592 407b 8d49 7a1d94feeb1f jpg x bce process image format f auto w 1440 h 810 data weibo 0 class lazy title 下月上线微软 Teams 会议将支持用户临时修改名称 data original https img ithome com newsuploadfi 2025 1 5f76915d 1592 407b 8d49 7a1d94feeb1f jpg x bce process image format f auto width 1440 height 461 p p data vmark cd75 style text align center img src https img ithome com newsuploadfi 2025 1 945b09a9 3754 4082 bcca 57d0c33fc855 jpg x bce process image format f auto w 1440 h 810 data weibo 1 class lazy title 下月上线微软 Teams 会议将支持用户临时修改名称 data original https img ithome com newsuploadfi 2025 1 945b09a9 3754 4082 bcca 57d0c33fc855 jpg x bce process image format f auto width 1440 height 461 p p data vmark f360 style text align center img src https img ithome com newsuploadfi 2025 1 62868774 813a 4eb4 8270 870792216892 jpg x bce process image format f auto w 1440 h 810 data weibo 2 class lazy title 下月上线微软 Teams 会议将支持用户临时修改名称 data original https img ithome com newsuploadfi 2025 1 62868774 813a 4eb4 8270 870792216892 jpg x bce process image format f auto width 1440 height 461 p p data vmark bca1 该功能适用于 Windows 和 Mac 系统的 Teams 桌面和 Web 应用程序用户修改过显示名称的参会者其姓名旁边会显示 edited 标签 p p data vmark 0b78 默认情况下该功能对所有租户关闭管理员可以在 Teams 管理中心为整个组织或选定成员启用该功能即使管理员启用了该功能会议组织者仍需在会议选项中开启允许用户编辑其显示名称才能在特定会议中使用此功能 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
年同比增长速度达 9.32% 领先竞争对手，Python 荣获 TIOBE 2024 年度编程语言
2天前
分享到:

年同比增长速度达 9.32% 领先竞争对手，Python 荣获 TIOBE 2024 年度编程语言p data vmark 429e a class s tag href https www ithome com target blank IT 之家 a 1 月 7 日消息 TIOBE nbsp 编程社区指数是一个衡量编程语言受欢迎程度的指标评判的依据来自世界范围内的工程师课程供应商及搜索引擎官方今日发文 strong 公布了 nbsp TIOBE 2024 nbsp 年度编程语言 Python strong 作为比较 TIOBE 2023 nbsp 年的 a href https www ithome com 0 744 014 htm target blank 年度编程语言为 nbsp C a p p data vmark 8df1 TIOBE nbsp 的 nbsp CEO nbsp Paul Jansen nbsp 表示 strong Python 去年同比增长达惊人的 9 32 strong 遥遥领先于其他竞争对手作为比较 Java 相比去年同比增长了 2 28 JavaScript 增长了 1 43 Go 增长了 1 24 p p style text align center data vmark d709 img src https img ithome com newsuploadfi 2025 1 6a285561 d51f 4601 b496 8551f09e8f1f jpg x bce process image format f auto w 1394 h 1140 data weibo 0 class lazy title 年同比增长速度达 9 32 领先竞争对手 Python 荣获 TIOBE 2024 年度编程语言 data original https img ithome com newsuploadfi 2025 1 6a285561 d51f 4601 b496 8551f09e8f1f jpg x bce process image format f auto width 1394 height 671 p p data vmark b9c5 当下 Python 几乎无处不在并且是许多领域的首选语言目前 Python 唯一的缺点是性能开销较大 p p data vmark 7730 Paul Jansen nbsp 同时表示 2024 年 TIOBE 指数中还有两件有趣的事 C 语言被 C 和 Java 超越如今 nbsp Java 和 C 正争夺排行榜前二的位置而 nbsp PHP 的第十名地位被谷歌 Go 语言所取代如今 Go 稳居前十 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
跨越灯控生态藩篱，微星、华擎同第三方同步软件 SignalRGB 达成合作
2天前
分享到:

跨越灯控生态藩篱，微星、华擎同第三方同步软件 SignalRGB 达成合作p data vmark 23ad a class s tag href https www ithome com target blank IT 之家 a 1 月 7 日消息 IT 之家从微星华擎的 a class s tag href https www ithome com tag ces2025 target blank CES 2025 a 新品发布新闻稿获悉这两大主板制造商已同第三方 RGB 灯效同步软件 SignalRGB 达成合作微星华擎主板的用户 strong 未来将在第一方的 Mystic Light 或 Poly Chrome 外获得新的官方支持灯控软件选择 strong p p data vmark c08e style text align center img src https img ithome com newsuploadfi 2025 1 1be034e3 8e19 4f52 b3b8 b68ce2c6be39 jpg x bce process image format f auto w 1440 h 480 data weibo 0 class lazy title 跨越灯控生态藩篱微星华擎同第三方同步软件 SignalRGB 达成合作 data original https img ithome com newsuploadfi 2025 1 1be034e3 8e19 4f52 b3b8 b68ce2c6be39 jpg x bce process image format f auto width 1440 height 273 p p data vmark a4cc style text align center img src https img ithome com newsuploadfi 2025 1 d8778bcc e985 4631 8f3e 4bb9b06b43b6 jpg x bce process image format f auto w 1200 h 1800 data weibo 1 class lazy title 跨越灯控生态藩篱微星华擎同第三方同步软件 SignalRGB 达成合作 data original https img ithome com newsuploadfi 2025 1 d8778bcc e985 4631 8f3e 4bb9b06b43b6 jpg x bce process image format f auto width 1200 height 1230 p p data vmark 7668 strong PC DIY 的 RGB 同步生态一直以来相对割裂 strong 不同厂商均推出了各自的灯控软件甚至此前存在个别不支持非自身软件的情况 p p data vmark 0233 而 SignalRGB 会自动检测所有已连接 RGB 和 ARGB 接头优化了跨品牌跨类别的 RGB LED 设备灯效同步设定从而为组装电脑主机提供了更好的 RGB 灯光定制和同步效果同时 strong 解锁了灯效与游戏交互等场景的可能 strong p p style text align center a class topic bar target blank href https www ithome com zt ces2025 CES 2025 消费电子展专题海量数码新品发布 a p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
多款 Chrome 浏览器扩展程序被植入恶意代码，以窃取用户数据
5天前
分享到:

多款 Chrome 浏览器扩展程序被植入恶意代码，以窃取用户数据p data vmark 43a2 a class s tag href https www ithome com target blank IT 之家 a 12 月 29 日消息据 BleepingComp 报道近期至少五款 Chrome 扩展程序遭受协同攻击攻击者通过注入恶意代码窃取用户敏感信息数据丢失防护公司 Cyberhaven 于 12 月 24 日率先披露了其扩展程序遭到入侵的消息原因是其在 Google Chrome 商店的管理账户遭遇了成功的网络钓鱼攻击 p p style text align center data vmark 4186 img src https img ithome com newsuploadfi 2024 12 f0c8a330 7fb4 45ee 88f7 3ce9c1b99d30 jpg x bce process image format f auto w 1440 h 810 data weibo 0 class lazy title 多款 Chrome 浏览器扩展程序被植入恶意代码以窃取用户数据 data original https img ithome com newsuploadfi 2024 12 f0c8a330 7fb4 45ee 88f7 3ce9c1b99d30 jpg x bce process image format f auto width 1440 height 461 p p data vmark 6336 据 IT 之家了解 Cyberhaven 的客户包括 Snowflake 摩托罗拉佳能 Reddit AmeriHealth Cooley IVP Navan 星展银行 Upstart 和 Kirkland amp Ellis 等知名企业攻击者劫持了 Cyberhaven 员工的账户并发布了恶意版本的 Cyberhaven 扩展程序版本号 24 10 4 strong 该版本包含可将已验证的会话和 Cookie 数据泄露到攻击者控制的域名 cyberhavenex pro 的代码 strong p p data vmark 5ae7 Cyberhaven 在发送给客户的邮件中表示其内部安全团队在检测到恶意程序后一小时内就将其下架干净版本的扩展程序版本号 24 10 5 已于 12 月 26 日发布除了升级到最新版本外 Cyberhaven Chrome 扩展程序的用户还被建议撤销所有非 FIDOv2 的密码轮换所有 API 令牌并检查浏览器日志以评估是否存在恶意活动 p p data vmark 947b 在 Cyberhaven 披露事件后 Nudge Security 的研究员 Jaime Blasco 根据攻击者的 IP 地址和注册域名进行了深入调查 Blasco 发现 strong 用于让扩展程序接收攻击者指令的恶意代码片段也在同一时间段被注入到其他四款 Chrome 扩展程序中 strong 包括 Uvoice ParrotTalks 等 Blasco 还发现了指向其他潜在受害者的更多域名但只有以上四款扩展程序被确认为携带了恶意代码片段 p p data vmark d4a7 建议用户将这些扩展程序从浏览器中移除或升级到 12 月 26 日之后发布的确认已修复安全问题的安全版本如果不确定扩展程序的发布者是否已获悉并修复了安全问题最好卸载该扩展程序重置重要的账户密码清除浏览器数据并将浏览器设置恢复到原始默认设置 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
Linux 挥别 WinXP 时代协议，USB RNDIS 即将退场
5天前
分享到:

Linux 挥别 WinXP 时代协议，USB RNDIS 即将退场p data vmark 0d9f a class s tag href https www ithome com target blank IT 之家 a 1 月 2 日消息 Linux 基金会研究员 Greg Kroah Hartman 计划在 Linux 内核中 strong 彻底移除 USB RNDIS 协议驱动 strong p p data vmark ab76 IT 之家查询公开资料 USB RNDIS 是一种远程网络驱动接口规范将 USB 设备模拟成网卡从而在计算机和设备之间建立网络连接简单来说就是通过 USB 线缆实现 TCP IP over USB 的功能 p p data vmark db2b 该协议源于微软 Windows XP 时代存在诸多安全漏洞 Hartman 早在 2022 年 11 月就提出移除它的提议 p p data vmark 5637 Hartman 于 2024 年 12 月 23 日再次推送提案认为这个古老的协议已经不再必要反而会让系统存在诸多安全隐患容易受到网络威胁 p p data vmark 42e8 他明确指出任何使用 RNDIS 协议连接不受信任主机或设备的系统都存在安全风险最佳方案就是尽快移除 p p data vmark c04c style text align center img src https img ithome com newsuploadfi 2025 1 c0cd037d e6dc 4e9b b4ab ac3b4ba698e4 jpg x bce process image format f auto w 800 h 1119 data weibo 0 class lazy title Linux 挥别 WinXP 时代协议 USB RNDIS 即将退场 data original https img ithome com newsuploadfi 2025 1 c0cd037d e6dc 4e9b b4ab ac3b4ba698e4 jpg x bce process image format f auto width 800 height 1119 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
微软 Edge 浏览器新特性前瞻：融入 Win11 系统托盘、AI 增强自动填充和收藏夹
5天前
分享到:

微软 Edge 浏览器新特性前瞻：融入 Win11 系统托盘、AI 增强自动填充和收藏夹p data vmark 27d5 a class s tag href https www ithome com target blank IT 之家 a 1 月 2 日消息科技媒体 Windows Latest 昨日 2025 年 1 月 1 日发布博文报道称在 Canary 频道最新 Microsoft Edge 浏览器中微软正测试 msTaskbarXUs 实验性 Flag strong 暗示 Windows 11 将更深度整合 Edge 功能 strong p h3 data vmark 15bd Windows 11 nbsp 系统托盘将添加 nbsp Edge nbsp 图标 h3 p data vmark 0820 该媒体反馈在启用该实验性 Flag 后相关特性暂未生效不过从名称判断应该是 Windows 11 系统托盘中会显示 Edge 浏览器的图标显示下载进度网页相关通知甚至可能还有关闭后台运行等操作 p h3 data vmark b2ee AI nbsp 自动填充 h3 p data vmark 6d5e IT 之家援引该媒体报道 Microsoft Edge 浏览器还进一步整合 AI 功能发现了 span class link text start with http msEdgeAutofi span 和 msEdgeAutofi 两个实验性 Flag 目前尚不清楚 Levo 的含义可能是某个小语言 AI 模型 p p data vmark aa98 style text align center img src https img ithome com newsuploadfi 2025 1 231b8fbe b432 4c30 b9ab 9be10f1e5f3f jpg x bce process image format f auto w 1219 h 849 data weibo 0 class lazy title 微软 Edge 浏览器新特性前瞻融入 Win11 系统托盘 AI 增强自动填充和收藏夹 data original https img ithome com newsuploadfi 2025 1 231b8fbe b432 4c30 b9ab 9be10f1e5f3f jpg x bce process image format f auto width 1219 height 571 p p data vmark 5048 该媒体推测 Edge 浏览器在启用上述实验性 Flag 后可以更智能地建议登录信息信用卡或地址等特别是对于经常填写送货表单的用户 Edge 能够学习用户习惯更快地提供所需信息 p h3 data vmark a8b0 增强收藏夹 h3 p data vmark ad4c 此外还发现了 msFavoritesR 和 msFavoritesL 两个实验性 Flag 预示着微软将升级 Edge 浏览器的收藏夹功能这些嵌入技术可能基于 AI 或索引方法让用户能够通过上下文而非仅仅标题或 URL 搜索书签实现更精准的查找 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p

云烟 2023年 4月 25日

你这文采，堪称现代李白

评论于 Servlet 数据库访问[通俗易懂]
样 2023年 4月 25日

博主有大厦之将倾而面不改色，狂澜于既倒而稳如泰山只能。

评论于 Servlet 数据库访问[通俗易懂]
样 2023年 4月 25日

博主好文采

评论于古天乐拍戏误伤眼球缝八针！而他第一时间却只想给粉丝道歉[通俗易懂]
样 2023年 4月 25日

干货干货

评论于 UG编程，钻孔攻丝，铣螺纹，干货知识[亲测有效]
云烟 2023年 4月 25日

人家是chatGPT 不是GBT

评论于程序开发中MySql、SQLServer、SQLite数据库的使用场景及性能评测

联系我们YX

mu99908888

在线咨询：微信交谈

邮件：itzsgw@126.com

工作时间：时刻准备着!

关注微信