Discourse的搜索功能还有敏感词吗?

在我的论坛上,我有一些帖子涉及到一些关键词,今天测试的时候发现一些神奇的现象,例如搜索

人大代表, 斯大林

等单词的时候,搜不到!!!很奇怪对不对。因为其他词语都是正常的,包括搜索 “斯大” ,“人大代” 是可以找到的!这就神奇了。这是哪里出了问题?

还是,这个中文的分词器有敏感词的设置,或者收到了敏感词系统的影响?

你把问题描述清楚,最好附带截图。

你站里面有这个关键词的帖子么?

image
但是搜索 “斯大” 可以找到

image

诸如此类;总之,敏感词搜索,是找不到东西的。我不太清楚这个过程是怎么起作用的? 是因为在分词器的时候就被敏感了呢? 我发过去的信号被传输过程中被解析和修改了?

如果是前一种,那么还不用太担心——因为这只是分词器的问题。 如果是后一种,则是严重的问题了,这说明我发给我的论坛的信息被解析了——也就是说,我还是被监控了。

你现在就在这个论坛搜索斯大林,就没有内容,搜索斯大 就有。不过我尝试了一下,这个论坛可以搜索到“人大代表”四个字,但是尝试了在我的论坛上搜索人大代表还是搜不到。

亚克西,还真是,不知道神马问题

我想知道这个中文分词工具到底是在那里内置的。

这个应该是中文基础支持包的功能。

因为绝大多数地方支持双击选择文字,只要是中文,无论是MS Office Word/Excel这些,双击的时候会自动选择出来对应的单词;还是在永中Office; 还是在中文网站中;甚至是在这样英文内核的Discourse中只不过有中文基础支持,就已经能够实现双击自动选择分词了。这说明中文分词和自动匹配选择——是内置在一个非常非常底层的包里面的。