魔術師をめざして

魔術師を目指して、相場・数学・プログラム言語を研究しています。

Wget vs Anemone


Pythonのほうは、早い時点で見放したが、
RubyのAnemonoは、最後まで気になっていた。
ライブラリの中じゃ一番いいかも。
ぼくは、Pythonライブラリへの期待が大きすぎるのかも。
機械学習といwば、Pythonと言われるが、これもどうか?

結局、単体のWgetが一番ってことになった。
Anemoneは、該当ページごとのスクレイピング処理を
書くことができるが、まずは読みこんでしまい、
gawk(ゴーク)で、必要なデータをスクレイピングするほうが、
分かり易いだろう。ぼくは、そう考えた。
皆さんも、WgetGnuのサイトで手に入れてみよう。
Gnuの公式サイトは、うぃきぃでわかるよ。
目の悪いぼくでも探し出したのだから、
目の健康な人なら、楽勝だよ。
gawkGnuwindows用バイナリが手に入る。

クローリング → Wget(ダブリュゲット)
スクレイピングgawk(ゴーク)

が一番楽で分かり易いというのが、魔術師の結論。