[問題] 將數字的部分複製貼上，並縮排? njpp PTT批踢踢實業坊

[問題] 將數字的部分複製貼上，並縮排?

作者: njpp (正妹真難找) 2021-11-16 22:30:21

想問一下各位大大
https://www.cnblogs.com/hanmk/p/12747093.html
目前想要將這個網頁的程式碼，拿到我的pycharm 翻譯器做實驗
但是，整篇文章開頭都有卡數字，整篇複製貼上會變成如下:
整個排版大亂~
15 # print(response.text)
16 return response.text
17 else:
18 return None
19 except RequestException:
20 print("请求失败")
21 # return None
22
23
24 def parse_html(html_text):
25 html = etree.HTML(html_text)
26
27 if len(html) > 0:
28 img_src = html.xpath("//img[@class='photothumb
lazy']/@data-original") # 元素提取方法
29 # print(img_src)
30 return img_src
31
32 else:
33 print("解析页面元素失败")
python又是很重視排版的語言，所以必須要手動一個一個刪除前面的數字
但是仍然會亂掉....
想問一下，有沒有好一點的複製貼上方法，可以變成:
def parse_html(html_text):
html = etree.HTML(html_text)
if len(html) > 0:
img_src = html.xpath("//img[@class='photothumblazy']/@data-original") # 元素提取方法
# print(img_src)
比較符合以上快速又簡潔符合python語法的排版? 謝謝!
先貼到 NotePad++ 再轉到pycharm嗎?

作者: cocoaswifty (coco) 2021-11-16 23:02:00

shift+option 上下點選刪整排數字

作者: lycantrope (阿寬) 2021-11-16 23:20:00

用regex findall 取代就好 ( *\d+)

作者: cuteSquirrel (松鼠) 2021-11-17 00:11:00

windows 可以用Alt+滑鼠左鍵選垂直的前幾排刪掉

作者: poototo (poototo) 2021-11-17 08:29:00

notepad手動幾次搜尋取代即可，練習正規

作者: papple23g (逆道者) 2021-11-18 10:52:00

https://regex101.com/r/BDJUfB/1

作者: jennya (Jennya) 2021-11-19 23:59:00

google 「pycharm column selection」就可以一次選取多行的前幾個字元&一鍵刪除，notepad+貌似也有，你可google看看然後上面的regex全都不行，要是程式碼裡有數字不就很麻煩，就算要用regex也是用這個「^...」，^是一行的開頭的意思，使用這個regex會找到每行前三個字元，再按replaceall取代成空白即可。

作者: papple23g (逆道者) 2021-11-20 02:37:00

前三字元行數破百就不行了吧

作者: lycantrope (阿寬) 2021-11-20 10:41:00

上面regex可以增加條件吧， ^\s*\d+

繼續閱讀

[問題] 想問能寫入中文字的pdf套件obviate [問題] python之sorted list大小排序之問題swwy1661 [問題] macos的python3安裝matplotlib一直失敗ghost010178 [問題] 請教如何爬取分頁連結garlic774 [問題] 模組與類別的選擇時機jijuan [問題] 產品與linux系統控制混合ggggggh [閒聊] 數學不好怎麼玩AI??areyo [教學] FinMind 大數據專案X架構解析f496328mm [問題] 如何使用pyserial 控制D1 Mini LEDsoandy [問題] Multiprocess 中 Process 回傳問題請教wheado