今回、第1回目の Elasticsearch 入門という事で、今回は「インデックスを設計する際に知っておくべき事」というテーマにしてみました。ここでのインデックスの設計とは RDB のデータベースとかテーブル、ビューの設計に当たるところです。
Elasticsearch は RDB…
第2回目の Elasticsearch 入門は「データスキーマ設計のいろは」です。
設計と言うほどでもないのですが、例えば RDB で検索にフォーカスした設計や、他の検索エンジンも経験していると、これまでの制限や習慣で Elasticsearch の特徴を生かせない設計をしてしまう事があるので、このテーマにしてみました。
今回は「検索の基本中の基本」について解説したいと思います。この Elasticsearch 入門シリーズは今回で4回目になりますが、検索エンジンなのにやっと検索の話です。
Elasticsearch の検索のパワーをフルに活用するには、以下の内容を理解する必要があります(検索や集計の精度を向上させるなど)。
前回は「データスキーマ設計のいろは」というテーマで Elasticsearch にインデックスするためのドキュメント構造の設計について説明しました。 今回は「ドキュメント管理の基本」というテーマで、そのドキュメントを追加・更新・削除する操作の基本を解説します。
きっと、他の検索エンジンと比べ、その高機能ぶりに驚くはずです。
ElasticsearchをベースにTwitter利用者の性別判定システムを構築する。
Twitter 利用者の趣味嗜好など興味分野の分析であれば、以前公開した「Elasticsearch Twitter ツィート情報リアルタイム分類」のようにツィートの内容をベースに名詞系の品詞に特徴が出てくるのでそれほど難しくはないのですが、性別判定の場合はちょっと勝手が違います。
入社3日目の木戸です。入りみだれるチャットコミュニケーションにあたふたしつつも、社内のドキュメントなどを読みあさりながら、少しづつ会社にも慣れてきたかな?といった感じです。
そのうち「Elasticsearch 入門シリーズ」でも連載しようかと考えているのですが、今回記念すべき1本目のブログは、