Easy Scraper - プログラミング不要のビジュアルウェブスクレイパー、ワンクリックでウェブデータを取得できるかもしれない最も簡単なウェブスクレイパー [Chrome] - 小众软件#
#Omnivore
Easy Scraperは非常に使いやすいウェブスクレイパーツールで、Chrome ブラウザに対応しています。完全にビジュアルな操作で、URL リストを提出し、必要な領域を選択するだけで、データやテキストを一括で取得できます。.csv、.json 形式でエクスポートすることもできます。@Appinn
ウェブスクレイパーとは?#
ここでのウェブスクレイパーとは、ウェブスクレイパーのことで、通常は自分でプログラムを書く必要があります。たとえば、Python 言語はよくスクレイピングに使用されます。主な機能は、ウェブページの情報を自動的に収集することです。たとえば、電子商取引サイトのすべての携帯電話の価格を取得したい場合、ページをめくることもできますが、プログラムを書けばすぐにできます。
Easy Scraper は Chrome の拡張機能で、非常に簡単に使用できます。
個別のページに対して#
たとえば、小众软件のホームページ(https://www.appinn.com)で、最新の記事リストを取得したい場合、拡張バーの Easy Scraper ボタンをクリックし、表示される新しいページで Change List ボタンをクリックし、データを取得したい場所にマウスを移動させます。ここでは最新の記事です。Easy Scraper が関連するすべてのコンテンツデータを取得してくれます。URL、画像リンク、カテゴリリンク、時間、要約などの情報も含まれます:
その後、データをエクスポートして処理することができます。すごいですね。
複数のページに対して#
複数のウェブページを同時に処理したい場合は、まずこれらのウェブサイトのリンクを取得する必要があります(上記の個別のページに対しての方法を使用するなど)。その後、一括処理ができます。
公式には、Amazon の製品のタイトル、価格、評価をどのように取得するかを非常に具体的に示したビデオがあります:
とても簡単です。
特徴#
- ワンクリックスクレイピング:どのウェブサイトのどのリストでもワンクリックでスクレイピングできます。
- ディープスクレイピング:一連のウェブページリンクを取得した後、各リンクをさらにスクレイピングできます。
- データのエクスポート:スクレイピングしたデータを CSV または JSON 形式で保存でき、後で使用できます。
- ダイナミックコンテンツに対応:JavaScript でレンダリングされたコンテンツも適切に処理でき、複雑なウェブサイトからもデータをスクレイピングできます。
青小蛙はいくつかの例を挙げています:
市場調査などを行っている場合、各大手電子商取引プラットフォームでの製品の価格やレビューを収集する必要がある場合、これを使用すると非常に便利です。
特定のトピックに関する記事を書く必要があるが、手動で検索して情報を整理するのが面倒だと感じる場合、Easy Scraper を使用して関連するウェブページのコンテンツを自動的にまとめることができます。
入手方法#
原文:https://www.appinn.com/easy-scraper/
次回は、.csv .json ファイルの内容を GPT で処理する方法について研究しましょう。