/var/log/messages

debugging with sixth sense

Img タグの Alt 属性

バイト製造にて取り出さなきゃ、な機会があったのですが scrapy だと簡単でした。

css で抽出して

lines = selector.css(query)

その範疇からタグと属性で取得できました。

alts = lines.css('img').xpath('@alt').extract()

あとは条件に合致する文字列かどうかを判定して云々。もっと大変かと思ってたら意外に簡単でした。

Comments