不討論繁中簡中優劣性的問題也不討論政治,謝謝
主要在探討簡書的搜尋引擎有什麼可以改善
我遇到什麼困擾
我在簡書搜尋文章時常搜尋不到我要的結果,也可以說是搜尋引擎的精確度不夠高,想了一下有可能的原因就是我鍵入的是繁中關鍵字,如果提交搜尋請求時能將關鍵字轉換成簡體中文,必能大幅提高搜尋的容錯度,我想使用者並不會在意他搜尋出來的是繁中或簡中的文章,對吧?
可以改善什麼
舉例像筆者我想提升我的寫作能力,因此我在簡書搜尋欄位輸入寫作
做關鍵字搜尋,
只要標題或內容裡面有寫作
或写作
都是我要的搜尋結果
對搜尋引擎的疑惑
簡書這個平台是使用簡體中文的人比較多,所以文章的產出也是簡中的較多,照這個邏輯推論我搜尋写作
的搜尋結果應該會比寫作
要來得多,但結果出乎我意料之外
寫作
45445
写作31367
兩者相差了近14000筆結果
這不科學,意思是使用繁中來撰寫文章的用戶比簡中要來得活躍來得多嗎?
不相信結果的我仔細觀察一下每筆結果我想我發現了什麼
問題可能是出在
寫作
的搜尋結果
( 因為簡書會在搜尋結果上高亮出關鍵字用黃色做底色標記,所以我可以很容易觀察 )從搜尋結果的第二頁就開始出現模糊匹配的情形,像是
寫
,作
,寫寫
這三種關鍵字的竟然都被放到搜尋結果內也許你會說是用戶的搜尋關鍵字不夠準確,但你必須先預設大部分的用戶都是一般的使用者,不會像
Geek
用像正規表示式那樣的方法增加關鍵字的精準度
因此我可以說使用寫作
得到的那45445筆資料,有極高的比例都是垃圾資料,那写作
的那31367筆會有這樣的情形嗎?
還有待確認,至少我看了写作
的結果前十頁都是很精準的匹配到文章有写作
的標題或內容
改善後的結果
如果能改善上面提到的兩點
- 將簡中的搜尋結果也納入進來
- 對搜尋引擎做優化修正
最理想的搜尋結果應該是
這邊我改用更完整的關鍵字
寫作的能力
來做搜尋,以便列出搜尋結果的相關性排序
- 寫作的能力
- 写作的能力
- 寫作能力
- 写作能力
- 寫作
- 写作
- 能力
其實只要先坐到前面兩項的排序就可以了,如果能做到後面的表示搜尋引擎有智能化可以拆分段落做搜尋,我想那已經是很後期的優化工作
只是內部的搜尋引擎,何必那麼計較
我們又不是Google
, Baidu
, Bing
, Yahoo
這些靠搜尋引擎吃飯的公司,有必要投入那麼多資源在搜尋引擎嗎?
- 一個良好的搜尋引擎可以幫助使用者快速導向到他要的目標上
- 精簡後的搜尋結果能夠降低服務器負擔
- 藉由優化搜尋引擎的過程思考這些資料保存的結構化
- 精簡後的搜尋結果能夠讓客戶端快速渲染結果
因為筆者我對台灣某大討論區的搜尋引擎非常不滿,所以一定要來抱怨一下,希望有更多開發者能投入一些資源在內部搜尋引擎上頭,尤其是做文章分享相關,像討論區, 論壇這些平台的搜尋引擎都是非常重要且深度影響使用者體驗的,就算把工作交給Google自訂搜尋引擎
也要去追蹤使用者體驗
看到像簡書這樣有自己的搜尋框還是令人高興的,雖然還有進步的空間但能自行處理搜尋引擎的工作已經很佩服,我是簡書粉,我希望簡書能變得更好
网友评论