Luxorの全文検索で検索できない記号や文字が知りたい。
INDEX生成とINDEX検索の文字制限については、以下の通りとなります。
- 区切り符号・区切り記号
- つなぎ符号・つなぎ記号(ダッシュ類)
- 音声符号・音声記号
- その他の符号・記号(音楽・商業・他)
- 天体・星座記号・気象
- HTML特殊文字
- 機種依存文字
- 繰り返し符号・繰り返し記号
- しるし物1:目印・装飾類
- しるし物2:矢印類
- 単位記号
- 年号・曜日
- かっこ類
- 学術記号(数学・科学)
- ギリシャ文字
【記号制限一覧表】
記号種類 | 対象例 | V1 (Ver.1.X.X系) |
DAT(V2) (Ver.1.X.X系とVer.2.0.0系) |
V1とV2 比較 |
JPT (Ver.2.0.0系) |
DATとJPT 比較 |
---|---|---|---|---|---|---|
区切り符号/区切り記号 | 。、﹆﹅・..,:;’!!! ? ¿ ?? ?! / \ | ¦ - = | INDEXされない。 検索できない。 |
INDEXされない。 検索できない。 |
一致する。 | INDEXされない。 検索できない。 |
一致する。 |
つなぎ符号/つなぎ記号(ダッシュ類) | — - ‑ 〜 = = ‥ … | INDEXされない。 検索できない。 |
INDEXされない。 検索できない。 |
一致する。 | INDEXされない。 検索できない。 |
一致する。 |
音声符号/音声記号 | ♪ ~ ゜ ¨ ː ˛ ˇ ^ ゛ ゜ ´` ¯ ー | 「ː(三角コロン、長音記号)」「ˇ(ハーチェク、ウェッジ)」のみインデックスされる。 検索できる。 |
「ː(三角コロン、長音記号)」「ˇ(ハーチェク、ウェッジ)」のみインデックスされる。 検索できる。 |
一致する | INDEXされない。 検索できない。 |
※一致しない。 |
その他の符号/記号(音楽 ・ 商業 ・ 他) |
♬ ♯ ♭ ♮ ♩ @ © ® ™ ☑ № ♳ ♷ ☢ ☰ ☱ ① ❶ _ ﹅ & 〆 | 「〆(しめ)」のみINDEXされる。検索できる。 | 「〆(しめ)」「①➊(丸中数字)」「™(商標、トレードマーク)」「№(ナンバー)」のみINDEXされる。検索できる。 | ※一致しない。 V2 では、「①➊(丸中数字)」「™(商標、トレードマーク)」「№(ナンバー)」はINDEXされるようになる。 |
「①➊(丸中数字)」のみINDEXされる。検索できる。 | ※一致しない。 |
天体 ・ 星座記号 ・ 気象 |
☽ ☀ ☄ ♐ | INDEXされない。 検索できない。 |
INDEXされない。 検索できない。 |
一致する。 | INDEXされない。 検索できない。 |
一致する。 |
機種依存文字 | ⅷ ⅶ Ⅻ Ⅲ Ⅱ ⑲ ⑪ ④ | INDEXできない。 検索できない。 |
INDEXできる。 検索できる。 |
※一致しない。 | INDEXできる。 検索できる。 |
一致する。 |
HTML特殊文字 |     | INDEXできる。 検索できる。 |
INDEXできる。 検索できる。 |
一致する。 | INDEXできる。 検索できる。 |
一致する。 |
繰り返し符号/繰り返し記号 | 〃 仝 々 ヽ ヾ ヾ ゞ 〻 | 「〃(ノの字点、同じく記号)」以外はINDEXされる。 検索できる。 |
「〃(ノの字点、同じく記号)」以外はINDEXされる。 検索できる。 |
一致する。 | 「〻」のみINDEXされる。検索できる。 | ※一致しない。 |
しるし物 [1] 目印 ・ 装飾類 |
♨ 〶 〒 ☏ 卐 卍 ❤ ♦ ♡ ♧ ※ § ¶ ★ ◇ ❖ × ◆ 〓 • ▼ ▽ ◑ ⦿ ◎ ○ ● | 「卐(まんじ)」「卍(左まんじ)」のみインデックスされる。 検索できる。 |
「卐(逆まんじ)」「卍(左まんじ)」のみインデックスされる。 検索できる。 |
一致する。 | 「卐(逆まんじ)」「卍(左まんじ)」のみインデックスされる。 検索できる。 |
一致する。 |
しるし物 [2] 矢印類 |
→ ← ↑ ↓ ↗ ↙ ⇨ ⇦ | INDEXされない。 検索できない。 |
INDEXされない。 検索できない。 |
一致する。 | INDEXされない。 検索できない。 |
一致する。 |
単位記号 | Å ℓ ₣ € £ $ ¥ ‰ % ℉ ℃ ″ ′ ° | 「Å(オングストローム)」「ℓ(リットル)」のみインデックスされる。 検索できる。 |
「Å(オングストローム)」「ℓ(リットル)」のみインデックスされる。 検索できる。 |
一致する。 | 「Å(オングストローム)」「ℓ(リットル)」のみインデックスされる。 検索できる。 |
一致する。 |
年号 ・ 曜日 |
㍻ ㍼ ㊊ ㊎ ㊑ ㈱ ㈷ ㈫ | INDEXされない。 検索できない。 |
㍻ ㍼ ㊊ ㊎ ㊑形式はINDEXされる。検索できる。 ㈷ ㈫ ㈱系はINDEXされない。検索できない。 |
※一致しない。 V2では、㍻ ㍼ ㊊ ㊎ ㊑形式はINDEXされるようになる。 |
INDEXされない。 検索できない。 |
※一致しない。 |
かっこ類 | 「 」『 』( ) ) 〔 〕 〘 〙 [ ] 【 】 〖 〗 〈 〉 ‹ ›{ } ‘ ’ “ ” ‘ ’ “ ” 〝 〟 | INDEXされない。 検索できない。 |
INDEXされない。 検索できない。 |
一致する。 | INDEXされない。 検索できない。 |
一致する。 |
学術記号(数学 ・ 科学) |
+ - ± × ÷ = ≠ ∞ ♂ ♀ ∟ ≒ ∫ ⊆ Σ π | 「Σ(シグマ、総和記号)」「π(パイ、円周率記号)」のみINDEXされる。 検索できる。 |
「Σ(シグマ、総和記号)」「π(パイ、円周率記号)」のみINDEXされる。 検索できる。 |
一致する。 | 「Σ(シグマ、総和記号)」「π(パイ、円周率記号)」のみINDEXされる。 検索できる。 |
一致する。 |
ギリシャ文字 | γ Φ ξ λ ε β α δ | INDEXされる。 検索できる。 |
INDEXされる。 検索できる。 |
一致する。 | INDEXされる。 検索できる。 |
一致する。 |
※V1とV2はインデックス作成時の文字の分割方式となります。
※デフォルトはV2です。
検索精度向上オプションを使用しない場合(V1) | setup.conf内の項目schemaISEVer,schemaSDBVerがv1になっていることを確認する。 |
---|---|
検索精度向上オプションを使用する場合(V2) | setup.conf内の項目schemaISEVer,schemaSDBVerがv2になっていることを確認する。 |
詳細については、「Luxor Ver.1.3.6以上のリリースノート」をご確認ください。
※Luxor Ver.2.0.0から提供するスキーマは、それぞれDATとJPTと呼ばれます。DATスキーマは、V2と同じ。JPTは形態素解析型の分割方式となります。