MySQL全文检索

https://help.aliyun.com/document_detail/107083.html

知乎:https://zhuanlan.zhihu.com/p/417229576

官方文档:https://dev.mysql.com/doc/refman/5.7/en/fulltext-boolean.html

 

#添加全文索引

ALTER TABLE `biz_document` ADD FULLTEXT f_content (`content`) with parser ngram;

ALTER TABLE `biz_document` ADD FULLTEXT f_title (`title`) with parser ngram;

#搜索

SELECT * FROM biz_document WHERE MATCH (title) AGAINST ('最多跑一次' IN NATURAL LANGUAGE MODE); #自然语言模式

SELECT * FROM biz_document WHERE MATCH (title) AGAINST ('+最多跑一次 +管理' IN BOOLEAN MODE); #布尔模式

SELECT * FROM biz_document WHERE MATCH (title) AGAINST ('+最多跑一次 -管理' IN BOOLEAN MODE); #布尔模式

SELECT * FROM biz_document WHERE MATCH (title) AGAINST ('>最多跑一次 +MySQL' IN BOOLEAN MODE); #布尔模式


#自然语言模式: 文本的查询被转换为n-gram分词查询的并集。例如,where条件('信息系统')转换为('信息 息系 系统')
#布尔模式:文本查询被转化为n-gram分词的短语查询。 例如,where条件('信息系统')转换为("'信息 息系 系统'")。

#通配符查询: 如果前缀的长度比ngram_token_size小,那么查询结果将返回在全文索引中所有以这个词作为前缀的n-gram的词。
-- 如果前缀的长度大于等于ngam_token_size,那么这个查询则转换为一个短语(phrase search),通配符则被忽略, 改用短语查询。

#INSERT INTO biz_acticles (title) VALUES ('信息系统'), ('信息 系统'), ('信息的系统'), ('信息'), ('系统'), ('息系');

SELECT * FROM biz_acticles WHERE MATCH (title) AGAINST ('信息系统' IN NATURAL LANGUAGE MODE); #自然语言模式

SELECT * FROM biz_acticles WHERE MATCH (title) AGAINST ('信息系统' IN BOOLEAN MODE); #布尔模式

SELECT * FROM biz_acticles WHERE MATCH (title) AGAINST ('信息*' IN BOOLEAN MODE); #通配符查询

SELECT * FROM biz_acticles WHERE MATCH (title) AGAINST ('"信息 系统"' IN BOOLEAN MODE); #短语查询

show VARIABLES LIKE '%token%'; #ngram_token_size

 

ALTER TABLE tb_cust_order ADD FULLTEXT KEY `elec_addr_fulltext_idx` (`elec_addr`) with parser ngram;
ALTER TABLE tb_cust_order DROP INDEX elec_addr_fulltext_idx;

 

 

posted @ 2021-05-18 17:13  Peter.Jones  阅读(113)  评论(0)    收藏  举报