想問一下各位大大
https://www.cnblogs.com/hanmk/p/12747093.html
目前想要將這個網頁的程式碼,拿到我的pycharm 翻譯器做實驗
但是,整篇文章開頭都有卡數字,整篇複製貼上會變成如下:
整個排版大亂~
15 # print(response.text)
16 return response.text
17 else:
18 return None
19 except RequestException:
20 print("请求失败")
21 # return None
22
23
24 def parse_html(html_text):
25 html = etree.HTML(html_text)
26
27 if len(html) > 0:
28 img_src = html.xpath("//img[@class='photothumb
lazy']/@data-original") # 元素提取方法
29 # print(img_src)
30 return img_src
31
32 else:
33 print("解析页面元素失败")
python又是很重視排版的語言,所以必須要手動一個一個刪除前面的數字
但是仍然會亂掉....
想問一下,有沒有好一點的複製貼上方法,可以變成:
def parse_html(html_text):
html = etree.HTML(html_text)
if len(html) > 0:
img_src = html.xpath("//img[@class='photothumblazy']/@data-original") # 元素提取方法
# print(img_src)
比較符合以上快速又簡潔符合python語法的排版? 謝謝!
先貼到 NotePad++ 再轉到pycharm嗎?