[問題] 爬取圖文成檔案

作者: s4028600 (佑)   2019-12-25 00:28:11
爬文都只有只爬取圖片或文字
用requests和bs4爬取文字或圖片是會了
但是想要爬取成圖文混排
所以txt是沒辦法了
目前能夠圖文混排的格式打算用world或epub
但是不知道要怎麼爬取圖文
用bs4只會跑出圖片的連結
沒有頭緒了...
作者: Hsins (翔)   2019-12-25 00:59:00
能夠爬取連結就能夠對網際網路資源進行存取,再透過相關的套件操作 word 或 epub。關鍵字可以自己去搜,作法有很多,實際上要混排你也可以使用 html。兩年前你可以是小白,但不應該這麼久過去了,還不能夠自己找答案呀。
作者: junwh (What the hell)   2019-12-25 02:35:00
用Markdown如何
作者: dennisxkimo (Dennis(一上B就糟糕))   2019-12-25 09:36:00
選個可圖文並茂的檔案格式 爬到的內容寫出入該格式markdown(.md)或html都可 爬到資料怎麼使用 自由發揮載圖嵌入路徑 還是插連結 是看有沒有離線保存需要
作者: Hsins (翔)   2019-12-25 12:40:00
就算不是同一個功能,你兩年來似乎也沒有為了讓自己更理解這個工具去把英文念好不是嗎?當你要做的功能越趨複雜(對於你而言),你沒有讓自己有足夠的能力聽懂別人要表達什麼的時候,問再多都沒用。
作者: kobe8112 (小B)   2019-12-25 16:54:00
world...? 是指辦公室軟體word嗎?
作者: s4028600 (佑)   2019-12-25 19:00:00
對 我現在才發現多一個l
作者: dennisxkimo (Dennis(一上B就糟糕))   2019-12-25 19:29:00
你能爬資料 找到 文字 與圖片的連結 從來沒想過可以收集起來 再自己寫個程式 把收集來的 寫成一個檔案?看回應的code只接受現成的function套上而已這樣能力會被受限 永遠只能玩門口的東西
作者: s860134 (s860134)   2019-12-25 19:46:00
唉 建議學點 copy paste 外的東西
作者: vi000246 (Vi)   2019-12-26 00:27:00
拆解問題是解決問題的開始 爬到圖片網址 把圖載下來或是取得圖片stream 再隨便你要存成什麼排版
作者: jiyu520 (不要鯽魚我)   2019-12-26 14:57:00
加油

Links booklink

Contact Us: admin [ a t ] ucptt.com