雖然現代搜索引擎已經取得了很大的成功,但是我們也應當看到,現代搜索引擎仍然存在很多不足之處,主要表現為以下幾個方面:
首先,它缺乏信息收集和信息檢索的同步性。搜索引擎在檢索時依據的是利用爬蟲程序事先遍歷互聯網后得到的網頁索引信息,而由于遍歷互聯網需要大量的處理時間,爬蟲程序不可能隨時隨地地遍歷網絡,只能在確定的一定時間間隔內定期進行網絡信息采集,所以搜索引擎的源信息收集和用戶查詢是截然分開的。這導致一方面不能保證信息的及時更新,易產生“錯”鏈接和“死”鏈接,另一方面也無法利用用戶在檢索時表現的需求進行動態的信息反饋,使得信息的收集和查尋缺少有機的結合。
其次,它的信息檢索方式具有單一性。搜索引擎一般只能提供分類瀏覽的查詢檢索方式和基于關鍵詞的全文檢索方式。分類查詢按照嵌套的類目,讓用戶逐層深入以檢索所需信息,雖然方式很簡單,但是查全率較低,容易漏檢信息;而基于關鍵詞的全文檢索又因為匹配模式過于簡單,命中的結果中會含有大量無關的網頁,導致查準率降低。
再次,它的信息檢索內容具有單一性。網絡信息內容覆蓋面很廣,形式各異,不同用戶或同一用戶在不同時刻對信息需求的側重點也不一樣,而搜索引擎卻對所有用戶提供相同的界面和檢索策略,忽略了web用戶的個體差異,不能滿足web用戶的個性化需求,同時也難以使用戶有效表達自己的個性化需求,搜索引擎更缺乏對用戶個性化信息的利用,較難實現有針對性的個性化信息服務。
最后,它的信息服務方式具有被動性。大多數的搜索引擎還沒有擺脫以拉(pulling)為主的信息服務方式,而未來的信息服務方式則主要是基于特定查詢要求的推(pushing)方式。
上述因素產生的后果就是增大用戶使用負擔,降低查詢效果,這在一些學者的研究中也有表述。例如,2001年Starch通過調查指出,36%的互聯網用戶在1周內的網絡搜索時間超過2h,71 9/6的用戶在使用搜索引擎時,平均搜索12min后會遇到麻煩,這些搜索受挫中因為鏈接錯誤產生的占46%。同時,近86%的互聯網用戶認為應當出現更有效的信息檢索技術。另一項由Keen所做的調查顯示,人們平均每天要有4個問題需要從外界獲取答案,而其中31%的人會使用搜索引擎以獲取正確的信息,但是半數以上都會不成功。