pythonのpandasというモジュールがあるのですが、勉強不足なので使い方がわからず、csvモジュールを使ってスクレイピングしてみたという記事です。
pandasを使わずにcsvモジュールで代用する
libreoficeeでいいね数(列=lilkes)をソートするには 「データ」タブをクリックして→昇順か降順に並べ替えるをクリックします。 いいね数を降順にソートした結果、音楽とギャンブルがブルーオーシャンだということがわかりました(´・ω・`) 僕はpandasが使えないのでこの程度の分析しかできませんでした。 インターネットでもモジュールの概要を知ることはできるのですが、インターネットに落ちている情報は形だけ提示して解説をはぶいているものが多いです。ですが、その提示されたものを自分で使ってみればどんなものかわかると思います。(実際にモジュールを使ってプログラムを動かす)しかしこれを行動に移すにはエネルギーを必要とします。(ただの言い訳ですが) やはり本で学ぶのが一番かなーと思い始めています。 「退屈なことをpythonにやらせよう」のスクレイピング章に到達してずいぶんに横道にそれてしまっています。
Al Sweigart
オライリージャパン
売り上げランキング: 947
オライリージャパン
売り上げランキング: 947
大量のデータはエクセルやlibreoficeeでは扱えない?
これはさわってみればわかりますが、上のCSVファイルで70行ほどのデータになっていますが、70行程度のデータでもグラフを扱おうと思ったら、かなりもっさりした動きになります。スピーディーにデータを手に入れようと思っている人にとっては全く使い物にならないんです。 そのためにjuptyernotebookとかがあるのだと思います。