投稿

【グルメ】飲食店!Rettyからレストランの口コミをスクレイピング

イメージ
  Retty[レッティ]とは? 日本最大級の実名型グルメサービスRetty。Rettyでは、全国の信頼できる実名口コミを検索することができます。地図情報・営業時間・写真の情報も揃っています。自分だけのお店リストを作成することもできますが、FacebookやTwitterのアカウントを利用することでお友達や有名人のおすすめの飲食店情報やお店リストを共有することもできます。登録されている飲食店は約80万店で、口コミはもちろん新規飲食店情報も日々更新されています。全国各エリアや料理のジャンル、テーマ、地図などから多種多様に検索可能です。アプリダウンロード版もあり、外出先でも手軽に利用することが可能となっています。 スクレイピングツールの概要 ScrapeStorm とは、強い機能を持つ、プログラミングが必要なく、使いやすく人工知能 Webスクレイピングツール です。違う基盤のユーザーに二つの スクレイピング モードを提供し、1-Clickで99%の Webスクレイピング を満たします。 ScrapeStorm により、大量のWebデータを素早く正確的に取得できます。手動で データ抽出 が直面するさまざまな問題を完全に解決し、 情報取得 のコストを削減し、作業効率を向上させます。 抽出されたデータは下記のようにご覧ください 1.タスクを新規作成する Rettyの口コミページは「次へ」と言うページボタンがないので、今回はURLジェネレーター機能を利用して、URLを生成します。 (1)URLをコピーする 目標レストランの口コミページURLをコピーしてください。できるだけ第二ページのURLをコピーしてください。 (2)パラメーターを追加する URLジェネレーターでURLを入力して、パラメーターを追加画面にページ数を入力します。今回は10までです。生成したURLはプレビュー画面でチェックしてください。 2.タスクを構成する (1)ページボタン ScrapeStormは自動的にリスト要素とページボタンを識別できます。今回はURLを生成しますから、「スクロールローディング」に変更してください。 (2)詳細ページに行く 「詳細ページに行く」ボタンをクリックして、ソフトウエア口コミページに移動します。口コミを全て表示して、抽出できます。 (3)フィールドの追加と編集 「フィールド...

国内旅行!じゃらんから観光地の口コミをスクレイピング

イメージ
  じゃらんとは? 「じゃらん」は、日本国内で広く知られ、利用されている大手の旅行情報サイトおよび予約サイトです。日本国内のホテルや旅館などの宿泊施設の予約を提供しています。ユーザーは「じゃらん」を通じて宿泊施設を検索し、予約することができます。宿泊施設の種類は多岐にわたり、ユーザーの予算や好みに合わせて選択できます。実際に宿泊した人々のクチコミや評価を掲載しています。これにより、ユーザーは宿泊施設の品質やサービスについての情報を得ることができます。クチコミを読んで他の旅行者の体験を参考にすることができます。 スクレイピングツールの概要 ScrapeStorm とは、強い機能を持つ、プログラミングが必要なく、使いやすい人工知能 Webスクレイピングツール です。違う基盤のユーザーに二つの スクレイピング モードを提供し、1-Clickで99%のWebスクレイピングを満たします。 ScrapeStorm により、大量のWebデータを素早く正確的に取得できます。手動で データ抽出 が直面するさまざまな問題を完全に解決し、 情報取得 のコストを削減し、作業効率を向上させます。 抽出されたデータをご覧ください。 1.タスクを新規作成する (1)URLをコピーする 今回はある人気観光地の口コミ一覧ページからコメントを収得し、そのスクレイピング方法を紹介します。まず、URLをコピーしてください。 (2)スマートモードタスクを新規作成する ScrapeStormのホームページ画面にスマートモードタスクを新規作成します。また、持っているタスクをインポートすることもできます。 詳細には下記のチュートリアルをご参照ください。 スマートモードタスクの新規作成方法 2.タスクを構成する (1)自動識別 ScrapeStormは自動的にリスト要素とページボタンを識別できます。下記のチュートリアルも参照してください。 ページ分けの設定方法 (2)フィールドの追加と編集 「フィールドを追加」ボタンをクリックして、画面に必要な要素を選択、データが自動的に抽出されます。また、必要に応じてフィールドの名前の変更または削除、結合できます。 フィールドの設定の詳細には下記のチュートリアルをご参照ください。 抽出されたフィールドを配置する方法 3.タスクの設定と起動 (1)起動の設定 必要に応じて、...

分散チームとAI時代のソフトウェア開発の教訓

イメージ
  元記事: https://www.poppastring.com/blog/what-we-lost-the-last-time-code-got-cheap 私は以前、トレドにあるスタートアップ企業「Heartland Information Services」で働いていました。当社はアメリカ国内の大手病院向けに文字起こしサービスを提供しており、規模も小さくありませんでした。Heartlandは、当時のオフショア文字起こしの中心的企業の一つであり、サービスのダウンタイムが直接的な影響を及ぼす性質のものでした。想像してみてください。緊急手術が必要なのに、手術記録が紙で届くのを待たなければならない状況です。待つ余裕はありません。 当時インドで働くエンジニアは非常に優秀でした。会社はハイブリッド運営をしており、重要な開発作業は海外で行われ、国内でデプロイされることもありました。その理由は明快です:コストです。オフショア開発は圧倒的に安く、スタートアップにとっては無視できない節約になります。当時はトレンドでもあり、トマス・フリードマンの『The World Is Flat』が話題となり、国内の開発者たちは自分たちの職が脅かされるのではないかと不安に感じていました。 コード自体は良好でした。エンジニアは非常に才能のある人たちで、書かれるコードも問題なく動作しました。しかし、人間が関わる分散型システムでは避けられない現象があります。なぜそのコードがそのように作られたのかという意図が世界の片側に存在し、保守責任が反対側にある場合です。知識は存在しているのに、必要な時に必要な場所にないことがありました。 最近、私はHeartlandのことを思い出しています。この構図は今の状況に似ているからです。 コードを生成するコストは急激に下がりました。AIツールは機能的で、標準的なコードを、想像を絶する速さと低コストで生成できるようになりました。そして、これは過去のオフショア開発ブームと同じく、経済的に理にかなった現象です。AIが生成するコードは動作するし、テストも通ります。そのままリリースすることも可能です。 しかし、過去のパターンを振り返ると、コード生成のコストが下がると、本当のコストは消えません。それは「理解」に移ります。『Prediction Machines』でも指摘さ...

仕事探し・士業・事務!求人サイトSeekから求人情報をスクレイピング

イメージ
  Seekとは? Seek(シーク)は、オーストラリア発の大手求人検索プラットフォームで、オフィス系職種に特化した豊富な求人情報を掲載している信頼性の高いサイトです。事務職、経理、人事、カスタマーサポート、秘書業務など、さまざまなオフィス関連ポジションが常時10万件以上掲載されており、正社員から契約社員、リモートワークまで多様な働き方を探すことが可能です。 スクレイピングツールの概要 ScrapeStorm とは、強い機能を持つ、プログラミングが必要なく、使いやすい人工知能 Webスクレイピングツール です。違う基盤のユーザーに二つの スクレイピング モードを提供し、1-Clickで99%のWebスクレイピングを満たします。 ScrapeStorm により、大量のWebデータを素早く正確的に取得できます。手動で データ抽出 が直面するさまざまな問題を完全に解決し、 情報取得 のコストを削減し、作業効率を向上させます。 抽出されたデータをご覧ください。   1.タスクを新規作成する URLジェネレータ機能を利用し、直接リンクを生成してください。 (1)URLをコピーする 今回は会計の検索結果ページから求人情報を収得し、そのスクレイピング方法を紹介します。まず、第二ページのリンクをコピーしてください。   (2)パラメータを追加する URLジェネレータでURLを入力して、パラメーターを追加画面にページ数を入力し、生成したURLはプレビュー画面でチェックしてください。 URLジェネレータの使い方     2.タスクを構成する (1)自動識別 ScrapeStormは自動的にリスト要素とページボタンを識別できます。今回は「スクロールローディング」に変更してください。下記のチュートリアルも参照してください。 ページ分けの設定方法   (2)詳細ページに行く ソフトウェアの「詳細ページに行く」機能を利用し、雇用形態、勤務時間、語学力などの情報を抽出します。   (3)フィールドの追加と編集 「フィールドを追加」ボタンをクリックして、画面に必要な要素を選択、データが自動的に抽出されます。また、必要に応じてフィールドの名前の変更または削除、結合できます。 フィールドの設定の詳細には下記のチュートリアルをご参照くだ...

Rustは人間には難しい。でもAIには最高の教材だった

イメージ
  ここ10年、ソフトウェア業界の“暗黙のルール”はとてもシンプルでした。 「先にリリースした者が勝つ」。 新規プロジェクトで言語選定をする時、多くの企業は Python か TypeScript を選んできました。理由は単純です。エコシステムが巨大で、人材を集めやすく、コンポーネントを組み合わせれば、金曜には上司にデモを見せられる。 一方で、Rust や Go、C++ は性能面では Python を10倍、100倍上回ることもあります。しかし代償は重い。学習コストは高く、エンジニア採用も難しく、開発環境はすぐエラーを吐く。 だから皆、心の中では分かっていながら Python を選びました。 「性能最適化は後でやります」 実際には、その“後で”が来ることはほとんどありませんでした。 しかし今、その常識が崩れ始めています。 理由は LLM、大規模言語モデルです。 これまで「難しすぎる」「学習コストが高い」と敬遠されていたハードコアな言語を、AI が普通に書けるようになったからです。 複雑な言語を書く難易度を AI が吸収してくれるなら、なぜ私たちは低性能な言語に妥協し続ける必要があるのでしょうか。 人間には難しい言語ほど、AI は得意になる 2年前、GPT-4 に Rust を書かせると、存在しないライブラリ名を平然と生成していました。 しかし2026年現在、Claude、GPT-5.5、DeepSeek といったモデルは、もはや“コード生成AI”ではなく、ほぼ熟練エンジニアです。SWE-bench のような高難度ベンチマークでも、上級エンジニア級の性能を見せ始めています。 現在の AI は単純なロジックだけでなく、並列処理、競合状態、アーキテクチャ最適化のような低レイヤー領域にも強くなっています。 なぜ AI は Rust を好むのか。 先月、X の技術系ブロガー CtrlAltDwayne は、こんな言葉を投稿しました。 「2026年に Rust を選ぶ理由は、性能でもメモリ安全性でもない。AI が C++ より Rust を圧倒的に上手く書けるからだ。」 一見すると逆説的ですが、理屈はかなり筋が通っています。 Rust のコンパイラは、まるで厳格なチューターのように振る舞います。 そして、そのエラーメッセージは AI にとって極めて価値の高い“リアルタイ...