㈠ Fofa_Python3查詢腳本
周末在家,利用閑暇時間學習了如何通過Python實現對Fofa的查詢。此篇內容僅記錄學習過程,非專業指南。
在進行查詢時,注意查看鏈接結構,其中查詢語句經過了base64編碼,並被附加在鏈接後。但直接搜索到的並非所需IP鏈接,這需要進一步使用Fofa的API功能。
首先,驗證email和API key的准確性,這是基礎步驟。隨後,利用Fofa的查詢介面進行實際操作,根據介面返回的信息確認准確性。
通過API介面進行查詢,大大簡化了數據處理的復雜性。緊接著,從查詢結果的「results」部分提取出IP地址。
完成數據抓取後,即可對收集到的IP和網站進行批量操作,實現自動化處理。
㈡ Python(pandas)查詢數據5種方法
導入 pandas 庫並讀取 Excel 文件至數據幀 df。查看數據幀的前幾行,確保數據正確載入。
設置索引為「日期」,方便按日期篩選數據。可選參數 `inplace=True` 表示直接修改原始數據幀,而 `inplace=False` 則創建新對象。
檢查索引值是否已更改為日期格式。
替換「最低氣溫」和「最高氣溫」列中的「℃」後綴,並將值轉換為整數類型。
篩選特定日期的數據行與列,進行精確匹配查詢。
使用值列表進行批量查詢,獲取特定日期的多個列值。
通過行和列區間進行范圍查詢,查看特定日期范圍內的數據。
使用條件表達式查詢數據,根據多個條件篩選結果。
利用布爾列表進行條件查詢,確保查詢結果的長度與所需條件相匹配。
調用函數查詢,通過 Lambda 表達式或自定義函數實現復雜條件查詢。
舉例說明,查詢特定條件下的數據,如最高溫度小於0度,最低溫度大於-10度,天氣為晴天,風力風向為「北風 微風 /東北風 微風」。
通過自定義函數查詢特定月份和風力風向的數據。
以上內容展示了使用 pandas 庫進行數據查詢的五種方法,每種方法都針對不同需求提供了靈活的查詢手段。
㈢ 基於CTD化合物名稱批量檢索Pubchem的CID號
批量檢索Pubchem的CID
在科研、教育或化學產業領域,獲取准確的化合物信息是日常工作的重要部分。PubChem,作為一個公開的化學資料庫,為廣大科研工作者和化學愛好者提供了豐富的化學物質數據。今天,我們將介紹如何使用Python批量檢索PubChem中的化合物CID(化合物識別號),以簡化和加速您的化學數據查詢過程。
什麼是CID?
CID,即Compound ID,是PubChem資料庫中用於唯一標識化合物的數字。每個CID對應一個特定的化學物質,包含了該物質的結構、名稱、生物活性等信息。
為什麼需要批量檢索CID?
在進行化學研究或數據分析時,我們經常需要查詢大量化合物的信息。手動一個個查找既耗時又低效。批量檢索CID可以讓我們快速獲取需要的化合物數據,從而更有效地進行科研工作和數據分析。
如何批量檢索CID?
使用Python和pubchempy庫,我們可以輕松實現批量檢索CID的功能。以下是一個簡單的步驟指南:
1. 安裝必要的軟體包
確保您的Python環境中已安裝必要的庫,包括pubchempy。
2. 讀取CTD數據
此段代碼載入了數據,然後篩選出了包含「減少表達」交互作用的化合物。
3. 葯物篩選
這里進一步篩選了具有明確「減少表達」標記(decreases^expression)的化合物名稱。
4. 批量查詢
通過編寫相應的代碼,實現對篩選出的化合物名稱進行批量查詢,獲取它們的CID。
通過上述步驟,您將能夠批量檢索Pubchem的CID,極大地提高您的工作效率。這將幫助您更快速、更准確地獲取所需化學物質數據,從而支持您的科研工作或數據分析任務。