※ 引述《qazasdfg15 (qazasdfg15)》之銘言:
: 不該java和c++的
: 聽說c# python angular好寫很多
: 有垃圾回收機制 好像沒pointer
: 人家已經vs2022 windowsserver
: 我還在ubuntu上餵豬公
: static Response *post(Request *);
: 話說python值得學嗎 能結合AI很方便的樣子
寫了個ptt簡易版爬蟲
版權沒有 要存成py檔才能用喔哈哈XD
# 要引入才能用
import json, bs4, random, time, requests
# ptt domain name
domain = "https://www.ptt.cc"
# ptt route 換頁用
route = "/bbs/Marginalman/index.html"
# ptt jsonList 給jsonfile存檔用
jsonList = []
# 爬個約200筆左右
for i in range(10):
# 把url組合起來
response = requests.get(domain + route)
# BeautifulSoup解析
result = bs4.BeautifulSoup(response.text, 'html.parser')
# ptt的標題們在r-ent元素
article = result.find_all('div', class_ = 'r-ent')
for j in article:
jsonDict = {}
title = j.find('a').text
author = j.find('div', class_ = 'author').text
timestamp = j.find('div', class_ = 'date').text
url = domain + j.a['href']
# 印出標題 作者 發文時間 網址
print("標題=>", title)
print("作者=>", author)
print("發文時間=>", timestamp)
print("網址=>", url)
print("