pythonでスクレイピングをしてそれを分析しようと思ったらpandasというモジュールを使う必要があります。しかしモジュールを使用するにあたり、新しいメソッドをその都度覚えないといけないので、これはめんどくさいです。そんなこともあって別にLibreofficeでいいんじゃね?と思ったのがこれをやろうと思ったきっかけです。
Libreofficeを設定変更で高速化する
Libreofficeを高速化する前の設定値を確認しておく
- [ツール]-[オプション]-[読み込み/保存]-[全般]の「読み込む」内の「プリンタ設定をドキュメントとともに読み込む」のチェックを外した
- メニューから、[ツール]- [オプション]-[LibreOffice] - [メモリー]
メモリー項目の設定変更前の値を確認する
- 「LibreOffice用に使用」― 381MB
- 「オブジェクト当たりのメモリー」― 12.0MB
メモリー項目の設定変更後の値
下記のとおり設定項目の値を変更しました。
- 「LibreOffice用に使用」― 600MB
- 「オブジェクト当たりのメモリー」― 60.0MB
メモリ項目の設定変更を行った結果
設定変更を行いましたがあまり体感速度はかわりませんでした。
やはり行が100行くらいあるデータですとかなり重たい感じがします。LibreOfficeの利点はGUI操作で簡単に昇順降順に並べ替えられることです。その機能は本当に助かります。しかも1列を並べかえたら他の列にも派生するので、簡単な分析だったらできるので便利です。
しかしpythonのpandasモジュールを駆使すれば詳細にデータを分析することができるようです。LibreOfficeネタだったのですが、pythonの話になってしまっていますね。ただやはり大量のデータを扱うにはプログラミングをマスターするしかなさそうです。
コメント