⑴ java调用python,有第三方包gensim,怎么调用呢,是报错。求教....
Jython(原JPython),是一个用Java语言写的Python解释器。
在没有第三方模块的情况下,通常选择利用Jython来调用Python代码,
它是一个开源的JAR包,你可以到官网下载
一个HelloPython程序
importorg.python.util.PythonInterpreter;
publicclassHelloPython{
publicstaticvoidmain(String[]args){
PythonInterpreterinterpreter=newPythonInterpreter();
interpreter.exec("print('hello')");
}
}
什么是PythonInterpreter?它的中文意思即是“Python解释器”。我们知道Python程序都是通过解释器来执行的,我们在Java中创建一个“解释器”对象,模拟Python解释器的行为,通过exec("Python语句")直接在JVM中执行Python代码,上面代码的输出结果为:hello
在Jvm中执行Python脚本
interpreter.execfile("D:/labs/mytest/hello.py");
如上,将exec改为execfile就可以了。需要注意的是,这个.py文件不能含有第三方模块,因为这个“Python脚本”最终还是在JVM环境下执行的,如果有第三方模块将会报错:javaImportError:Nomolenamedxxx
仅在Java中调用Python编写的函数
先完成一个hello.py代码:
defhello():
return'Hello'
在Java代码中调用这个函数:
importorg.python.core.PyFunction;
importorg.python.core.PyObject;
importorg.python.util.PythonInterpreter;
publicclassHelloPython{
publicstaticvoidmain(String[]args){
PythonInterpreterinterpreter=newPythonInterpreter();
interpreter.execfile("D:/labs/hello.py");
PyFunctionpyFunction=interpreter.get("hello",PyFunction.class);//第一个参数为期望获得的函数(变量)的名字,第二个参数为期望返回的对象类型
PyObjectpyObject=pyFunction.__call__();//调用函数
System.out.println(pyObject);
}
}
上面的代码执行结果为:Hello
即便只是调用一个函数,也必须先加载这个.py文件,之后再通过Jython包中所定义的类获取、调用这个函数。
如果函数需要参数,在Java中必须先将参数转化为对应的“Python类型”,例如:
__call__(newPyInteger(a),newPyInteger(b))
a,b的类型为Java中的int型,还有诸如:PyString(Stringstring)、PyList(Iterator<PyObject>iter)等。
详细可以参考官方的api文档。
包含第三方模块的情况:一个手写识别程序
这是我和舍友合作写的一个小程序,完整代码在这里:
importjava.io.*;
classPyCaller{
privatestaticfinalStringDATA_SWAP="temp.txt";
privatestaticfinalStringPY_URL=System.getProperty("user.dir")+"\test.py";
(Stringpath){
PrintWriterpw=null;
try{
pw=newPrintWriter(newFileWriter(newFile(DATA_SWAP)));
}catch(IOExceptione){
e.printStackTrace();
}
pw.print(path);
pw.close();
}
publicstaticStringreadAnswer(){
BufferedReaderbr;
Stringanswer=null;
try{
br=newBufferedReader(newFileReader(newFile(DATA_SWAP)));
answer=br.readLine();
}catch(FileNotFoundExceptione){
e.printStackTrace();
}catch(IOExceptione){
e.printStackTrace();
}
returnanswer;
}
publicstaticvoidexecPy(){
Processproc=null;
try{
proc=Runtime.getRuntime().exec("python"+PY_URL);
proc.waitFor();
}catch(IOExceptione){
e.printStackTrace();
}catch(InterruptedExceptione){
e.printStackTrace();
}
}
//测试码
publicstaticvoidmain(String[]args)throwsIOException,InterruptedException{
writeImagePath("D:\labs\mytest\test.jpg");
execPy();
System.out.println(readAnswer());
}
}
实际上就是通过Java执行一个命令行指令。
⑵ 如何用python做数据分析
首先,是数据分析的模块,numpy 高效处理数据,提供数组支持,很多模块都依赖它,比如pandas,scipy,matplotlib都依赖他,所
以这个模块都是基础。所以必须先安装numpy。
然后,pandas 主要用于进行数据的采集与分析,scipy 主要进行数值计算。同时支持矩阵运算,并提供了很多高等数据处理功能,比如
积分,微分方程求样等。matplotlib 作图模块,结合其他数据分析模块,解决可视化问题,statsmodels 这个模块主要用于统计分析,
Gensim 这个模块主要用于文本挖掘,sklearn,keras 前者机器学习,后者深度学习。
然后,安装的numpy版本一定要是带mkl版本的,没有返回值的,修改原处的值,这里等于修改了Xx.max() # 最大值,对二维数组都管
用x.min() # 最小值,对二维数组都管用x1=x[1:3] # 取区间,和python的列表没有区别。
然后,通过pandas导入数据,pandas支持多种输入格式,我这里就简单罗列日常生活最常用的几种,对于更多的输入方式可以查看源码
后者官网。csv文件导入后显示输出的话,是按照csv文件默认的行输出的,有多少列就输出多少列。
更多学习内容,请点击《Python学习网》!