打開源代碼,我們能找到一串亂碼,很明顯,答案就在裡面了。
首先,我們要得到他,直接複制粘貼顯然不是一個好方法。
url="http://www.pythonchallenge.com/pc/def/ocr.html"#網頁位址
from urllib import request #子產品引入
from collections import Counter
page = request.urlopen(url) #獲得頁面
html = page.read() #打開頁面
str = html.decode('utf-8') #對獲得的内容進行utf-8編碼
現在我們已經獲得這個網頁的原碼了
想看的話,我們可以
接下來,我們明顯是要獲得那串亂碼
str_begin=str.find('-->\n<!--') #查找起始位置
str=str[str_begin:] #截取字元串
準備工作完成了,接下來,我們隻需要找稀有字元就行了
c=Counter(str) #統計各個字元出現的次數,并生成字典
#print(''.join([i[0] for i in c.items() if i[1]==1]))#輸出,功能同下。但是看起來高大上啊!!
for i in c.items():
if i[1]==1:
print(''.join(i[0]),end="")