Python BeautifulSoup 要素の抽出

.string


要素を抽出するときにテキスト部分だけを抽出するやりかた

ele = soup.select("a")
ele[0].contents[0]
#もしくわ
ele[0].string


.prettify


#htmlの構造をきれいに整えてくれてみやすくなります

element.prettify()


next_sibling


#next_sibling一回だけだと「\n」が抽出されるので二回繰り返す

soup.select("ul")[0].li.nextsibling.nextsibling


next_sibligns


#兄弟要素をすべて取得します

#for分でまわします
for sib in soup.select("ul")[0].li.next_siblings: 
    print(sib.h3.a.string if sib != "\n" else "") #if分で改行があったとき空白に変更