電子書籍・おすすめ本!DDMブックスから書籍の情報をスクレイピング
DDMブックスとは? DMMブックス(DMM Books)は、DMM.comが提供する総合電子書籍プラットフォームで、漫画・小説・ビジネス書・雑誌・写真集・BL・TL・成人向けまで幅広いジャンルを取り扱っています。収録作品は126万冊以上、そのうち無料作品が2万~3万冊以上、フルカラー漫画やアダルト作品を豊富に扱い、読み放題プラン(FANZA)も提供します。 スクレイピングツールの概要 ScrapeStorm とは、強い機能を持つ、プログラミングが必要なく、使いやすい人工知能 Webスクレイピングツール です。違う基盤のユーザーに二つの スクレイピング モードを提供し、1-Clickで99%のWebスクレイピングを満たします。 ScrapeStorm により、大量のWebデータを素早く正確的に取得できます。手動で データ抽出 が直面するさまざまな問題を完全に解決し、 情報取得 のコストを削減し、作業効率を向上させます。 抽出されたデータをご覧ください。 1.タスクを新規作成する (1)URLをコピーする 今回はビジネスの作品一覧ページから書籍の情報を収得し、そのスクレイピング方法を紹介します。まず、URLをコピーしてください。 (2)スマートモードタスクを新規作成する ScrapeStormのホームページ画面にスマートモードタスクを新規作成します。また、持っているタスクをインポートすることもできます。 詳細には下記のチュートリアルをご参照ください。 スマートモードタスクの新規作成方法 2.タスクを構成する (1)自動識別 ScrapeStormは自動的にリスト要素とページボタンを識別できます。下記のチュートリアルも参照してください。 ページ分けの設定方法 (2)詳細ページに行く ソフトウェアの「詳細ページに行く」機能を利用し、出版社、ジャンル、書籍の概要を抽出します。 (3)フィールドの追加と編集 「フィールドを追加」ボタンをクリックして、画面に必要な要素を選択、データが自動的に抽出されます。また、必要に応じてフィールドの名前の変更または削除、結合できます。 フィールドの設定の詳細には下記のチュートリアルをご参照ください。 抽出されたフィールドを配置する方法 3.タスクの...