試験 | 分野 |
ITパスポート | ストラテジ系 > 企業活動 > 業務分析・データ利活用 |
ビッグデータとは?
ビッグデータとは、従来のDBMS(データベース管理システム)では運用、蓄積、解析が難しい巨大なデータ群の事。
多くの場合、ビッグデータとは単にデータ量が多いだけでなく、様々な種類・形式が含まれる非構造化データ・非定型的データであり、さらに日々膨大に生成・記録される時系列性・リアルタイム性のあるようなものを指すことが多い。
詩乃
非構造化データとは、テキスト・音声・動画・画像・SNS・Webページなどから得られるデータの事です。また、反対に構造化データとは、Excelのような「列」「行」からなるテーブル形式のデータの事です。
ビッグデータが持つ3つの特性
- Volume … データ容量
- 膨大なデータ量
- Variety … データの多様性
- テキスト、画像、音声といった多様な種類・形式のデータを含む
- Velocity … データ生成速度・頻度
- リアルタイムで収集できるデータ・秒単位など高頻度のデータ
詩乃
非構造化データとは従来の構造化データ(Excelのような「列」「行」からなるテーブル形式のデータ)と異なり、テキスト・音声・動画・画像・SNS・Webページなどから得られるデータこの様な膨大なデータ群を蓄積、解析する事で、これまでに無い新たな仕組みやシステムを産み出す可能性が高まるとされてます。