作者:
toyboy (打雜小弟兼職菸酒生)
2022-10-09 17:25:27hi, 各位大大
小弟之前有寫爬蟲每周爬取及保護股權分散表,從上周後好像網頁改版後就無法抓取,
試了一周還是搞不定,只能來求助大神幫忙解惑,感謝
錯誤訊息如下
<html><body><h1>SRVE0255E: A WebGroup/Virtual Host to handle
/smWeb/QryStockAjax.do has not been defined.</h1><br/><h3>SRVE0255E: A
WebGroup/Virtual Host to handle www.tdcc.com.tw:443 has not been
defined.</h3><br/></body></html>
資料爬取方式
import requests
from bs4 import BeautifulSoup as BS
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.5060.134 Safari/537.36'}
info = {'SYNCHRONIZER_TOKEN':'c0fa73d9-db72-499f-a10f-d87cb046c047',
'SYNCHRONIZER_URI': '/portal/zh/smWeb/qryStock',
'method': 'submit',
'firDate': '20221007',
'scaDate': '20221007',
'sqlMethod': 'StockNo',
'stockNo': '2330',
'stockName': ''
}
res = requests.post('https://www.tdcc.com.tw/smWeb/QryStockAjax.do', data =
info, headers = headers)
soup = BS(res.text, "lxml")
print(soup)
作者:
surimodo (好吃棉花糖)
2022-10-09 22:34:00post裡面網址改成qryStock那個原始網址就可以或者你給一下當初爬出來資料長怎樣我看能不能幫你做到資料格式輸出
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 07:29:00
感謝,換網址就有抓到東西了,只是分散表部分查無資料看起來是SYNCHRONIZER_TOKEN驗證碼擋下,現在要抓的分散表都顯示查無資料
作者:
surimodo (好吃棉花糖)
2022-10-10 10:47:00有資料阿 就算爬蟲出來的看不懂你自己用原始網頁點一點的沒跑出資料?
作者:
surimodo (好吃棉花糖)
2022-10-10 06:34:00post裡面網址改成qryStock那個原始網址就可以或者你給一下當初爬出來資料長怎樣我看能不能幫你做到資料格式輸出
作者:
surimodo (好吃棉花糖)
2022-10-10 06:34:00post裡面網址改成qryStock那個原始網址就可以或者你給一下當初爬出來資料長怎樣我看能不能幫你做到資料格式輸出
作者:
surimodo (好吃棉花糖)
2022-10-10 06:34:00post裡面網址改成qryStock那個原始網址就可以或者你給一下當初爬出來資料長怎樣我看能不能幫你做到資料格式輸出
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 15:29:00
感謝,換網址就有抓到東西了,只是分散表部分查無資料看起來是SYNCHRONIZER_TOKEN驗證碼擋下,現在要抓的分散表都顯示查無資料
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 15:29:00
感謝,換網址就有抓到東西了,只是分散表部分查無資料看起來是SYNCHRONIZER_TOKEN驗證碼擋下,現在要抓的分散表都顯示查無資料
作者:
surimodo (好吃棉花糖)
2022-10-10 18:47:00有資料阿 就算爬蟲出來的看不懂你自己用原始網頁點一點的沒跑出資料?
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 15:29:00
感謝,換網址就有抓到東西了,只是分散表部分查無資料看起來是SYNCHRONIZER_TOKEN驗證碼擋下,現在要抓的分散表都顯示查無資料
作者:
surimodo (好吃棉花糖)
2022-10-10 18:47:00有資料阿 就算爬蟲出來的看不懂你自己用原始網頁點一點的沒跑出資料?
作者:
surimodo (好吃棉花糖)
2022-10-10 18:47:00有資料阿 就算爬蟲出來的看不懂你自己用原始網頁點一點的沒跑出資料?
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 20:13:00
手動點是有資料,但用爬回來的看起來都顯示查無此資料,檢視From Date內的SYNCHRONIZER_TOKEN每次手動查詢都會變才想說是不是這個值要先想怎麼抓最新的,不然無法爬
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 20:13:00
手動點是有資料,但用爬回來的看起來都顯示查無此資料,檢視From Date內的SYNCHRONIZER_TOKEN每次手動查詢都會變才想說是不是這個值要先想怎麼抓最新的,不然無法爬
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 20:13:00
手動點是有資料,但用爬回來的看起來都顯示查無此資料,檢視From Date內的SYNCHRONIZER_TOKEN每次手動查詢都會變才想說是不是這個值要先想怎麼抓最新的,不然無法爬
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-11 06:09:00
爬到資料了,感謝S大熱心協助,謝謝
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-11 06:09:00
爬到資料了,感謝S大熱心協助,謝謝
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 12:13:00
手動點是有資料,但用爬回來的看起來都顯示查無此資料,檢視From Date內的SYNCHRONIZER_TOKEN每次手動查詢都會變才想說是不是這個值要先想怎麼抓最新的,不然無法爬
作者: toyboy (打雜小弟兼職菸酒生) 2022-10-10 22:09:00
爬到資料了,感謝S大熱心協助,謝謝
作者: class99 (class99) 2022-12-10 22:11:00
我能產生動態token, 但爬下來的html檔案沒有集保資料S 大的圖片檔不在了, 可以再傳一次嗎? 謝謝