Google搜索技巧
本文最后更新于 2024年9月6日 下午
四阶段的智能化人机交互
第一个阶段,使用倒排索引解决匹配的效率问题,使用文档模型解决基本的相关性,使搜索引擎变得可用、可扩展,代表比如 Infoseek 。这一阶段只保证了基本的文字相关性,搜索的真正效果是无法保证的。
第二个阶段,使用超链模型,比如 Google 的 PageRank 算法和百度的超链分析技术。解决信息的权威性问题,使搜索质量有了质的飞跃。从这一阶段开始,搜索引擎快速普及与并进入商业化,为 Google 和百度这样的公司带来了丰厚的利润。
第三个阶段,一方面使用更复杂的规则和机器学习排序模型,综合考虑了用户的行为特征,如商品评论、点赞、收藏、购买等,使得搜索引擎的结果再次提升一个档次,这些在电商等垂直搜索上表现的会更加明显;另一方面,基于各种先进的自然语言处理技术,充分挖掘用户搜索行为日志,对 query 进行分析改写以召回更多更好的结果。
第四个阶段,从「有框」搜索时代步入更加人工智能的「无框」搜索时代。人机交互方式也将更多的是问答式的自然语言加语音的方式,而搜索引擎也更像一个智能机器人,理解人的自然语言问题,提供更加直接有效的知识和答案。这一阶段目前尚处于起步阶段,Google、Amazon 以及一些优秀的创业公司都在进行积极的探索。
谷歌搜索技巧
搜索指令 | 功能 | 示例 |
---|---|---|
@ | 搜索社交媒体 | |
$ | 搜索特定价格 | camera $400 |
# | 搜索 # 标签 | #throwbackthursday |
- | 从搜索结果中排除特定字词 | 马云语录 - 女人 |
“” | 搜索完全匹配的结果 | “tallest building” |
.. | 在某个数字范围内执行搜索 | camera $50..$100 |
OR(大写) | 组合搜索 | marathon OR race |
site: | 搜索特定网站 | site:chongbuluo.com |
related: | 搜索相关网站 | related:time.com |
info: | 获取网站详情 | info:giffox.com |
cache: | 查看网站的 Google 缓存版本 | cache:google.com |
\ | 效用等同于 OR | apple\google, apple OR google |
* | 泛搜索,表征未知部分,只适用于英文 | * is the mother of success |
《》 | 只查询图书、影视作品,只适用于中文 | 《钢铁是怎样炼成的》 |
def: | 查询关键词的定义 | def:diversity / google def: |
inurl | 查找在 URL 地址里有搜索关键词的页面 | inurl:download |
intitle | 查找在网页标题里有搜索关键词的页面 | intitle: |
filetype | 查找特定文件格式的结果 | 机器学习 filetype:csv |
link: | 查看网站的反向链接 | link:chongbuluo.com |
AROUND | 搜索包含给点单词之间最大分隔数的网页 | 华为 AROUND (5) 必然 |
(完)
参考
Google搜索技巧
https://maojun.xyz/blog/2024/03/Google搜索技巧.html