㈠ Fofa_Python3查询脚本
周末在家,利用闲暇时间学习了如何通过Python实现对Fofa的查询。此篇内容仅记录学习过程,非专业指南。
在进行查询时,注意查看链接结构,其中查询语句经过了base64编码,并被附加在链接后。但直接搜索到的并非所需IP链接,这需要进一步使用Fofa的API功能。
首先,验证email和API key的准确性,这是基础步骤。随后,利用Fofa的查询接口进行实际操作,根据接口返回的信息确认准确性。
通过API接口进行查询,大大简化了数据处理的复杂性。紧接着,从查询结果的“results”部分提取出IP地址。
完成数据抓取后,即可对收集到的IP和网站进行批量操作,实现自动化处理。
㈡ Python(pandas)查询数据5种方法
导入 pandas 库并读取 Excel 文件至数据帧 df。查看数据帧的前几行,确保数据正确加载。
设置索引为“日期”,方便按日期筛选数据。可选参数 `inplace=True` 表示直接修改原始数据帧,而 `inplace=False` 则创建新对象。
检查索引值是否已更改为日期格式。
替换“最低气温”和“最高气温”列中的“℃”后缀,并将值转换为整数类型。
筛选特定日期的数据行与列,进行精确匹配查询。
使用值列表进行批量查询,获取特定日期的多个列值。
通过行和列区间进行范围查询,查看特定日期范围内的数据。
使用条件表达式查询数据,根据多个条件筛选结果。
利用布尔列表进行条件查询,确保查询结果的长度与所需条件相匹配。
调用函数查询,通过 Lambda 表达式或自定义函数实现复杂条件查询。
举例说明,查询特定条件下的数据,如最高温度小于0度,最低温度大于-10度,天气为晴天,风力风向为“北风 微风 /东北风 微风”。
通过自定义函数查询特定月份和风力风向的数据。
以上内容展示了使用 pandas 库进行数据查询的五种方法,每种方法都针对不同需求提供了灵活的查询手段。
㈢ 基于CTD化合物名称批量检索Pubchem的CID号
批量检索Pubchem的CID
在科研、教育或化学产业领域,获取准确的化合物信息是日常工作的重要部分。PubChem,作为一个公开的化学数据库,为广大科研工作者和化学爱好者提供了丰富的化学物质数据。今天,我们将介绍如何使用Python批量检索PubChem中的化合物CID(化合物识别号),以简化和加速您的化学数据查询过程。
什么是CID?
CID,即Compound ID,是PubChem数据库中用于唯一标识化合物的数字。每个CID对应一个特定的化学物质,包含了该物质的结构、名称、生物活性等信息。
为什么需要批量检索CID?
在进行化学研究或数据分析时,我们经常需要查询大量化合物的信息。手动一个个查找既耗时又低效。批量检索CID可以让我们快速获取需要的化合物数据,从而更有效地进行科研工作和数据分析。
如何批量检索CID?
使用Python和pubchempy库,我们可以轻松实现批量检索CID的功能。以下是一个简单的步骤指南:
1. 安装必要的软件包
确保您的Python环境中已安装必要的库,包括pubchempy。
2. 读取CTD数据
此段代码加载了数据,然后筛选出了包含“减少表达”交互作用的化合物。
3. 药物筛选
这里进一步筛选了具有明确“减少表达”标记(decreases^expression)的化合物名称。
4. 批量查询
通过编写相应的代码,实现对筛选出的化合物名称进行批量查询,获取它们的CID。
通过上述步骤,您将能够批量检索Pubchem的CID,极大地提高您的工作效率。这将帮助您更快速、更准确地获取所需化学物质数据,从而支持您的科研工作或数据分析任务。