『壹』 請問如何用python將字典轉換到txt文本中
1、首先打開python的一個文件。
『貳』 python基礎語法知識詢問
由於Python語言的簡潔、易讀以及可擴展性,在國外用Python做科學計算的研究機構日益增多,一些知名大學已經採用Python教導學生程序設計的首選編程語言。例如麻省理工學院的計算機科學及編程導論課程就使用Python語言講授。
想必大家還想了解到更多知識技能,接下來就跟千鋒武漢Python培訓的老師就來分享一下Python基礎語法的四大知識點,希望大家會喜歡。
一、標識符
a)概念:對變數,常量,函數,類等對象起的名字。嚴格區分大小寫。
b)標識符命名規則:
語法要求(硬性):
i.必須以字母或者下劃線開頭(支持中文,中文也是字元)
ii.必須以字母,數字,下劃線組成
iii.區分大小寫
iv.不能和關鍵字和內置函數名同名。
代碼規范(彈性):
v.變數名全部小寫,常量全部大寫(代碼規范,不是語法要求)
vi.類名用大寫駝峰(代碼規范)、
vii.模塊和包名用小寫
二、關鍵字
a)Import keyword keyword.kwlist 查看所有關鍵字
三、注釋
a)單行:#開頭
b)多行:每行使用#
c)文檔注釋:使用三個引號包括起來(」」」 XXX 「」」),這種注釋專門為函數或者類形成說明文檔。注釋必須跟在定義體下面,不能再任意位置。
四、代碼頭兩行
a)#!/usr/bin/env Python:指定運行代碼的解釋器,linux專用,windows不需要。在linux下添加改行,則可以使用./xxx.py執行。如果使用Python xxx.py則不需要改行。
b)# -*- coding:utf-8 -*- :代碼的編碼方式
『叄』 python 遞歸實現組合
用迭代器比較好
def combin(items, n=None):
if n is None:
n = len(items)
for i in range(len(items)):
v = items[i:i+1]
if n == 1:
yield v
else:
rest = items[i+1:]
for c in combin(rest, n-1):
yield v + c
for i in range(len([1,2,3,4])):
for j in combin([1,2,3,4], i+1):
print j,
『肆』 關於機器學習應用不得不思考哪些問題
機器學習是一種能夠賦予機器學習的能力以此讓它完成直接編程無法完成的功能的方法。但從實踐的意義上來說,機器學習是一種通過利用數據,訓練出模型,然後使用模型預測的一種方法。
讓我們具體看一個例子。
圖4房價的例子
拿國民話題的房子來說。現在我手裡有一棟房子需要售賣,我應該給它標上多大的價格?房子的面積是100平方米,價格是100萬,120萬,還是140萬?
很顯然,我希望獲得房價與面積的某種規律。那麼我該如何獲得這個規律?用報紙上的房價平均數據么?還是參考別人面積相似的?無論哪種,似乎都並不是太靠譜。
我現在希望獲得一個合理的,並且能夠最大程度的反映面積與房價關系的規律。於是我調查了周邊與我房型類似的一些房子,獲得一組數據。這組數據中包含了大大小小房子的面積與價格,如果我能從這組數據中找出面積與價格的規律,那麼我就可以得出房子的價格。
對規律的尋找很簡單,擬合出一條直線,讓它「穿過」所有的點,並且與各個點的距離盡可能的小。
通過這條直線,我獲得了一個能夠最佳反映房價與面積規律的規律。這條直線同時也是一個下式所表明的函數:房價=面積*a+b
上述中的a、b都是直線的參數。獲得這些參數以後,我就可以計算出房子的價格。
假設a=0.75,b=50,則房價=100*0.75+50=125萬。這個結果與我前面所列的100萬,120萬,140萬都不一樣。由於這條直線綜合考慮了大部分的情況,因此從「統計」意義上來說,這是一個最合理的預測。
在求解過程中透露出了兩個信息:
1.房價模型是根據擬合的函數類型決定的。如果是直線,那麼擬合出的就是直線方程。如果是其他類型的線,例如拋物線,那麼擬合出的就是拋物線方程。機器學習有眾多演算法,一些強力演算法可以擬合出復雜的非線性模型,用來反映一些不是直線所能表達的情況。
2.如果我的數據越多,我的模型就越能夠考慮到越多的情況,由此對於新情況的預測效果可能就越好。這是機器學習界「數據為王」思想的一個體現。一般來說(不是絕對),數據越多,最後機器學習生成的模型預測的效果越好。
通過我擬合直線的過程,我們可以對機器學習過程做一個完整的回顧。首先,我們需要在計算機中存儲歷史的數據。接著,我們將這些數據通過機器學習演算法進行處理,這個過程在機器學習中叫做「訓練」,處理的結果可以被我們用來對新的數據進行預測,這個結果一般稱之為「模型」。對新數據的預測過程在機器學習中叫做「預測」。「訓練」與「預測」是機器學習的兩個過程,「模型」則是過程的中間輸出結果,「訓練」產生「模型」,「模型」指導「預測」。
『伍』 怎麼樣python爬蟲進行此網站爬取
是加密的,解密方法在JS裡面可以弄出來。
首先要AES解密,可以【Python:import Crypto.Cipher.AES】包,解密mode是CFB,seed是"userId:"+uid+":seed"的SHA256值,解密的key是seed[0:24],iv是seed[len(seed)-16:]。
如果沒有登錄,uid就是用的"anyone",這時候的seed是"",也就是key為"61581AF471B166682A37EFE6",iv為"C8F203FCA312AAAB"。
解密後文件是壓縮過的,解壓即可得到一個JSON。這部分解壓我沒仔細看他的演算法,好像是gzip,直接用【Python:import gzip】解壓有點出錯,可能沒用對或者不是這個演算法,你在研究一下。第二種投機的方法就是,可以通過【Python:import execjs】直接調用他的pako.js文件的JS的inflate()函數來解壓這塊。JS代碼混淆後看起來是非常難懂的,使用這種做法可以不用太看懂加密的演算法,效率當然寫Python實現這個解密演算法低1點咯。
最後的JSON再用【Python:import demjson】解析,text的value就是文檔。