天天看點

pythonchallenge第二關orc

打開源代碼,我們能找到一串亂碼,很明顯,答案就在裡面了。

首先,我們要得到他,直接複制粘貼顯然不是一個好方法。

url="http://www.pythonchallenge.com/pc/def/ocr.html"#網頁位址
from urllib import request		#子產品引入
from collections import Counter
page = request.urlopen(url)		#獲得頁面
html = page.read()				#打開頁面
str = html.decode('utf-8')		#對獲得的内容進行utf-8編碼
           

現在我們已經獲得這個網頁的原碼了

想看的話,我們可以

接下來,我們明顯是要獲得那串亂碼

str_begin=str.find('-->\n<!--') #查找起始位置
str=str[str_begin:]			#截取字元串
           

準備工作完成了,接下來,我們隻需要找稀有字元就行了

c=Counter(str)		#統計各個字元出現的次數,并生成字典
#print(''.join([i[0] for i in c.items() if i[1]==1]))#輸出,功能同下。但是看起來高大上啊!!
for i in c.items():
    if i[1]==1:
        print(''.join(i[0]),end="")