2022年7月6日水曜日

スクレイピング

 前とは別のサイトをスクレイピングするスクリプトが書けた。

かなり、妥協したスクリプトになった。

「次へ」のボタンの表示が無くなったら、終了!としたかったが、

「最大ページ数」を手動で設定する仕様にしてしまった。

めんどくさいが、しょうがない。

今回のターゲットのサイトは、かなりスクレイピング対策されているサイトなのです。

なかなか、エレメントを特定できないし、

モーダルウィンドウ開くし、

クラス名同じdivがいっぱいあるし、

なかなかのくせものでした。

いろいろと妥協することで、とりあえず、スクショと画像を保存することができるようになった。

まぁ、私のプログラミング力は、初心者レベルなので、

すっきりしないスクリプトしか 書けませんが、

それでOKってことです。

2 件のコメント:

  1. ちょくちょくいろいろ試しているから、スキルあるよね。
    うちの会社に来て仕事を一緒にしないかい? 人手が欲しい。

    返信削除
    返信
    1. せっかくのお誘いですが、
      私のプログラミング力は本当に初心者レベルなのです。
      とても売り物になる完成度でないのです。
      A4サイズの紙に収まるくらいのちょっとしたプログラムしか書けない。

      削除