[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
使用者(已經有用R 做過不少作品)
[問題敘述]:
版友好:
如題,想請問我用rvest的read_heml()爬下來的東西大概長這樣
> test
{xml_document}
<html>
[1] <body><table border="1">\n<caption>title ...
如果執行 test %>% html_text() 則解析html標籤 只剩下
[1] "title\n id\n aaa\n d\n ddd\n
e\n eee\n "
不知道能否單純把爬下來的html轉成字串,保留所有的標籤呢?
想要的結果:
<table border="1">
<caption>title</caption>
<tbody>
<tr>
<th>id</th>
<td colspan="3">aaa</td>
</tr>
<tr>
<th style="width:15%">d</th>
<td style="width:35%">ddd</td>
<th style="width:15%">e</th>
<td style="width:35%">eee</td>
</tr>
</tbody>
</table>'
google了一下好像沒找到相關解法所以上來發問
謝謝!
[程式範例]:
https://ideone.com/bbRbpg
[關鍵字]:
選擇性,也許未來有用