(一)規(guī)則 1、Google不支持通配符,如“*”、“?”等,只能做精確查詢,關鍵字后面的“*”或者“?”會被忽略掉。 2、Google對英文字符大小寫不敏感,“GOD”和“god”搜索的結果是一樣的。 3、Google的關鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。 4、Google對一些網絡上出現(xiàn)頻率極高的詞(主要是英文單詞),如“i”、“com”,以及一些符號如“*”、“.”等,作忽略處理,如果用戶必須要求關鍵字中包含這些常用詞,就要用強制語法“+”。 5、Google在搜索中的所有符號(+ - "" :等)都必須是英文字符 6、Google會忽略掉檢索詞之間的大多數(shù)標點符號, 但有兩種情況例外!單引號和連字符,它們不能被省略,當輸入了帶有連字符的檢索詞后!即可檢索帶有連字符的檢索詞!也可檢索不帶連字符的檢索詞!因此如果不能肯定使用的詞是否帶有連字符!則應該總是使用連字符" 7、Google 首先匹配按檢索式相同詞序含有這些檢索詞的網頁!所以應該按照檢索詞在句子中出現(xiàn)的詞序輸入檢索詞,Google 還優(yōu)先匹配檢索詞相互鄰接的網頁 (二)語法:+、-、OR、filetype 1、Google無需用明文的“+”來表示邏輯“與”操作,只要空格就可以了。 2、Google用減號“-”表示邏輯“非”操作。 示例:搜索所有包含“專題講座”而不含“計算機”的中文網頁 搜索式:專題講座 -計算機 3、Google用大寫的“OR”表示邏輯“或”操作 注意:小寫的“or”,在查詢的時候將被忽略;這樣上述的操作實際上變成了一次“與”查詢)。但是,關鍵字為中文的或查詢似乎還有BUG,無法得到正確的查詢結果 4、搜索某一類型文件,可用“filetype”來搜索。 示例:搜索文獻綜述的PDF文件 搜索式:文獻綜述 filetype:pdf (三)高級搜索語法:site,link,inurl,allinurl,intitle,allintitle 1、site:表示搜索結果局限于某個具體網站或者網站頻道(如 site:sina.com),或者是某個域名(如site:com)。如果是要排除某網站或者域名范圍內的頁面,只需用“-網站/域名”(如 site:-com)。 示例:搜索中文教育科研網站(edu.cn)上所有包含“文獻綜述”的頁面。 搜索式:"文獻綜述 site:edu.cn" 注意:冒號后不能有空格,否則,“site:”將被作為一個搜索的關鍵字。此外,網站域名不能有“http”以及“www”前綴,也不能有任何“/”的目錄后綴;網站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。諸如“文獻綜述 site:edu.sina.com.cn/1/”的語法是錯誤的。 2、link:搜索所有鏈接到某個URL地址的網頁?!?/span> 示例:搜索所有含指向華軍軟件園“www.newhua.com”鏈接的網頁。 搜索式:"link:www.newhua.com" 注意:“link”不能與其他語法相混合操作,所以“link:”后面即使有空格,也將被Google忽略 3、inurl:返回的網頁鏈接中包含第一個關鍵字,后面的關鍵字則出現(xiàn)在鏈接中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語法找到這些相關資源鏈接,然后,用第二個關鍵詞確定是否有某項具體資料。INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。 示例:查找MIDI曲“滄海一聲笑”。 搜索式:"inurl:midi 滄海一聲笑" 注意:“inurl:”后面不能有空格,Google也不對URL符號如“/”進行搜索。Google對“cgi-bin/phf”中的“/”當成空格處理。 4、allinurl:返回的網頁鏈接中包含所有查詢關鍵字,這個查詢的對象只集中于網頁的鏈接字符串。 示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現(xiàn)在鏈接中就是“域名/cgi-bin/phf”。 搜索式:“allinurl:“cgi-bin“ phf +com” 5、allintitle、intitle:用法類似于上面的allinurl和inurl,只是后者對URL進行查詢,而前者對網頁的標題欄進行查詢。網頁標題,就是HTML標記語言title中之間的部分。網頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。 示例:蘇東坡作品集 搜索式:"intitle : 蘇東坡作品" (四)Google的罕用高級搜索語法:related,cache,info 1、related:用來搜索結構內容方面相似的網頁。 示例:搜索所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等) 搜索式:"related:www.sina.com.cn/index.shtml" 2、cache:用來搜索Google服務器上某頁面的緩存,這個功能同“網頁快照”,通常用于查找某些已經被刪除的死鏈接網頁,相當于使用普通搜索結果頁面中的“網頁快照”功能。 3、info:用來顯示與某鏈接相關的一系列搜索,提供cache、link、related和完全包含該鏈接的網頁的功能。 示例:查找和新浪首頁相關的一些資訊。 搜索式:"info:www.sina.com.cn" (五)google查詢外文期刊PDF技巧 當給goole輸入要查的關鍵詞時,會出現(xiàn)海量的資料,大部分是沒用的,如果查找具體的文章,跟著再輸入"pdf",但一般情況下還是多的沒法看完。如果用"pii"代替“pdf",得到了理想的效果,查到的基本都是期刊文獻,”pii"是期刊文獻編號。 示例: 搜Camellia 搜索式:Camellia pii(代替Camellia PDF) (六)Google 給信息安全帶來的隱患 Google 的強大檢索功能給我們帶來方便的同時,也給網絡安全帶來了極大的隱患—Google Hacking,它利用Google 的搜索引擎快速查找存在脆弱性的主機以及包含敏感數(shù)據的信息。利用Google 超強的搜索能力,即使是一個初等的黑客也可以輕易獲取安裝了后門或有漏洞的主機、INC 文件、用戶名和密碼等敏感信息。 要防范Google Hacking,我們只需要在所要保護的網頁中加入以下代碼便可以達到目的: <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOSNIPPET"> 以上代碼的含義是阻止把本頁面的特定內容和U R L連接記錄到搜索引擎數(shù)據庫中。不過,加入代碼后,站點的信息不會馬上在搜索引擎的數(shù)據庫中消失,數(shù)據更新需要一個月的周期。另外,我們可以在服務器上安裝過濾工具,如在IIS 服務上加載urlscan。還可以利用相關工具在互聯(lián)網上進行搜索,如果發(fā)現(xiàn)站點的有關信息被濫用,就通過http://www .google. com /remove.html提交希望刪除的信息。同樣地Google 的更新也需要一段時間。 (七)查找軟件注冊碼 goolge 或baidu 輸入: 94fbr 軟件名稱 例如:94fbr XX軟件 原理:94fbr 是 微軟winxp 的注冊碼中的一項,凡是有注冊碼的網頁都會有winxp的注冊碼,你要找的軟件注冊碼一般也會在里面! (八)快速獲取代理服務器 在搜索欄輸入 +":8080" +":80" +":3128" ,回車后,就能得到很多端口為8080、80、3128的代理服務器名稱。 (參考多篇相關文獻總結) |