機械学習用データの収集方法
差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン次のリビジョン両方とも次のリビジョン | ||
機械学習用データの収集方法 [2017/06/04] – [Webスクレイピングのリンク集] adash333 | 機械学習用データの収集方法 [2017/06/04] – adash333 | ||
---|---|---|---|
行 5: | 行 5: | ||
そこで、これらの作業をできる限り自動化することが必要となってきますが、ウェブサイトから情報を抽出するコンピュータソフトウェア技術を、「Webスクレイピング」というらしいです。 | そこで、これらの作業をできる限り自動化することが必要となってきますが、ウェブサイトから情報を抽出するコンピュータソフトウェア技術を、「Webスクレイピング」というらしいです。 | ||
- | この言葉を初めて認識したのが2017年5月でした。[[おすすめの機械学習入門書2017年版]]でも紹介していますが、まず、以下の本がお勧めです。Python3で行う、Webスクレイピングの手法が事細かに説明されています。 | + | この言葉を初めて認識したのが2017年5月でした。[[おすすめの機械学習入門書2017年版]]でも紹介していますが、まず、以下の本がお勧めです。Python3で行う、Webスクレイピングの手法が事細かに説明されており、非常にお勧めです。こちらの本に記載があって初めて知ったのですが、Webスクレイピングを行った結果、悪意が全くないのに逮捕されてしまった事例([[https:// |
< | < | ||
行 19: | 行 19: | ||
=====Webスクレイピングのリンク集===== | =====Webスクレイピングのリンク集===== | ||
- | |||
- | 悪意が全くないのに逮捕されてしまった事例もあります。Webスクレイピングを行う際には、違法性がないかどうか、また相手に迷惑をかけていないか細心の注意を払った方がよいと思われます。 | ||
- | |||
- | [[https:// | ||
スクレイピングとAPIの違い | スクレイピングとAPIの違い |
機械学習用データの収集方法.txt · 最終更新: 2018/10/07 by 127.0.0.1