Python BeautifulSoup 要素の抽出

要素を抽出するときにテキスト部分だけを抽出するやりかた

ele = soup.select("a")
ele[0].contents[0]
#もしくわ
ele[0].string

#htmlの構造をきれいに整えてくれてみやすくなります

element.prettify()

#next_sibling一回だけだと「\n」が抽出されるので二回繰り返す

soup.select("ul")[0].li.nextsibling.nextsibling

＃兄弟要素をすべて取得します

＃for分でまわします
for sib in soup.select("ul")[0].li.next_siblings:　
    print(sib.h3.a.string if sib != "\n" else "") #if分で改行があったとき空白に変更