A. 濡备綍浣跨敤Node.js鐖鍙栦换镒忕绣椤佃祫婧愬苟杈揿嚭pdf鏂囦欢鍒版湰鍦
闇姹傦细
浣跨敤Node.js鐖鍙栫绣椤佃祫婧愶纴寮绠卞嵆鐢ㄧ殑閰岖疆
灏嗙埇鍙栧埌镄勭绣椤靛唴瀹逛互PDF镙煎纺杈揿嚭
濡傛灉浣犳槸涓钖嶆妧链浜哄憳锛岄偅涔埚彲浠ョ湅鎴戞帴涓嬫潵镄勬枃绔狅纴钖﹀垯锛岃风洿鎺ョЩ姝ュ埌鎴戠殑github浠揿簱锛岀洿鎺ョ湅鏂囨。浣跨敤鍗冲彲
浠揿簱鍦板潃:闄勫甫鏂囨。鍜屾簮镰
链闇姹备娇鐢ㄥ埌镄勬妧链锛歂ode.js鍜宲uppeteer
puppeteer 瀹樼绣鍦板潃: puppeteer鍦板潃
Node.js瀹樼绣鍦板潃:阈炬帴鎻忚堪
Puppeteer鏄璋锋瓕瀹樻柟鍑哄搧镄勪竴涓阃氲繃DevTools鍗忚鎺у埗headless Chrome镄凬ode搴撱傚彲浠ラ氲繃Puppeteer镄勬彁渚涚殑api鐩存帴鎺у埗Chrome妯℃嫙澶ч儴鍒嗙敤鎴锋搷浣沧潵杩涜孶I Test鎴栬呬綔涓虹埇铏璁块梾椤甸溃𨱒ユ敹闆嗘暟鎹銆
鐜澧冨拰瀹夎
Puppeteer链韬渚濊禆6.4浠ヤ笂镄凬ode锛屼絾鏄涓轰简寮傛ヨ秴绾уソ鐢ㄧ殑async/await锛屾帹钻愪娇鐢7.6鐗堟湰浠ヤ笂镄凬ode銆傚彟澶杊eadless Chrome链韬瀵规湇锷″櫒渚濊禆镄勫簱镄勭増链瑕佹眰姣旇缉楂桡纴centos链嶅姟鍣ㄤ緷璧栧亸绋冲畾锛寁6寰堥毦浣跨敤headless Chrome锛屾彁鍗囦緷璧栫増链鍙鑳藉嚭鐜板悇绉嶆湇锷″櫒闂棰桡纸鍖呮嫭涓斾笉闄愪簬镞犳硶浣跨敤ssh锛夛纴链濂戒娇鐢ㄩ珮鐗堟湰链嶅姟鍣ㄣ傦纸寤鸿浣跨敤链鏂扮増链镄凬ode.js锛
灏忚瘯鐗涘垁锛岀埇鍙栦含涓滆祫婧
const puppeteer = require('puppeteer'); // 寮曞叆渚濊禆
(async () => { //浣跨敤async鍑芥暟瀹岀编寮傛
const browser = await puppeteer.launch(); //镓揿紑鏂扮殑娴忚埚櫒
const page = await browser.newPage(); // 镓揿紑鏂扮殑缃戦〉
await page.goto('https://www.jd.com/'); //鍓嶅线閲岄溃 'url' 镄勭绣椤
const result = await page.evaluate(() => { //杩欎釜result鏁扮粍鍖呭惈镓链夌殑锲剧墖src鍦板潃
let arr = []; //杩欎釜绠澶村嚱鏁板唴閮ㄥ啓澶勭悊镄勯昏緫
const imgs = document.querySelectorAll('img');
imgs.forEach(function (item) {
arr.push(item.src)
})
return arr
});
// '姝ゆ椂镄剅esult灏辨槸寰楀埌镄勭埇铏鏁版嵁锛屽彲浠ラ氲繃'fs'妯″潡淇濆瓨'
})()
澶嶅埗杩囧幓 浣跨敤锻戒护琛屽懡浠 ` node 鏂囦欢钖 ` 灏卞彲浠ヨ繍琛岃幏鍙栫埇铏鏁版嵁浜 杩欎釜 puppeteer 镄勫寘 锛屽叾瀹炴槸镟挎垜浠寮钖浜嗗彟涓涓娴忚埚櫒锛岄吨鏂板幓寮钖缃戦〉锛岃幏鍙栧畠浠镄勬暟鎹銆
涓婇溃鍙鐖鍙栦简浜涓滈栭〉镄勫浘鐗囧唴瀹癸纴锅囱炬垜镄勯渶姹傝繘涓姝ユ墿澶э纴闇瑕佺埇鍙栦含涓滈栭〉涓镄勬墍链<a> 镙囩惧瑰簲镄勮烦杞缃戦〉涓镄勬墍链 title镄勬枃瀛楀唴瀹癸纴链钖庢斁鍒颁竴涓鏁扮粍涓銆
鎴戜滑镄刟sync鍑芥暟涓婇溃涓鍏卞垎浜嗕簲姝ワ纴 鍙链 puppeteer.launch() ,browser.newPage(), browser.close() 鏄锲哄畾镄勫啓娉曘
page.goto 鎸囧畾鎴戜滑铡诲摢涓缃戦〉鐖鍙栨暟鎹锛屽彲浠ユ洿鎹㈠唴閮╱rl鍦板潃锛屼篃鍙浠ュ氭¤皟鐢ㄨ繖涓鏂规硶銆
page.evaluate 杩欎釜鍑芥暟锛屽唴閮ㄦ槸澶勭悊鎴戜滑杩涘叆𨱍宠佺埇鍙栫绣椤电殑鏁版嵁阃昏緫
page.goto鍜宲age.evaluate涓や釜鏂规硶锛屽彲浠ュ湪async鍐呴儴璋幂敤澶氭★纴闾f剰锻崇潃鎴戜滑鍙浠ュ厛杩涘叆浜涓灭绣椤碉纴澶勭悊阃昏緫钖庯纴鍐嶆¤皟鐢╬age.goto杩欎釜鍑芥暟
娉ㄦ剰锛屼笂闱㈣繖涓鍒囬昏緫锛岄兘鏄痯uppeteer杩欎釜鍖呭府鎴戜滑鍦ㄧ湅涓嶈佺殑鍦版柟寮钖浜嗗彟澶栦竴涓娴忚埚櫒锛岀劧钖庡勭悊阃昏緫锛屾墍浠ユ渶缁堣佽皟鐢╞rowser.close()鏂规硶鍏抽棴闾d釜娴忚埚櫒銆
杩欐椂鍊欐垜浠瀵逛笂涓绡囩殑浠g爜杩涜屼紭鍖栵纴鐖鍙栧瑰簲镄勮祫婧愩
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://www.jd.com/');
const hrefArr = await page.evaluate(() => {
let arr = [];
const aNodes = document.querySelectorAll('.cate_menu_lk');
aNodes.forEach(function (item) {
arr.push(item.href)
})
return arr
});
let arr = [];
for (let i = 0; i < hrefArr.length; i++) {
const url = hrefArr[i];
console.log(url) //杩欓噷鍙浠ユ墦鍗
await page.goto(url);
const result = await page.evaluate(() => { //杩欎釜鏂规硶鍐呴儴console.log镞犳晥
return $('title').text(); //杩斿洖姣忎釜鐣岄溃镄则itle鏂囧瓧鍐呭
});
arr.push(result) //姣忔″惊鐜缁欐暟缁勪腑娣诲姞瀵瑰簲镄勫
}
console.log(arr) //寰楀埌瀵瑰簲镄勬暟鎹 鍙浠ラ氲繃Node.js镄 fs 妯″潡淇濆瓨鍒版湰鍦
await browser.close()
})()
涓婇溃链夊ぉ鍧 page.evaluate鍑芥暟鍐呴儴镄刢onsole.log涓嶈兘镓揿嵃锛岃屼笖鍐呴儴涓嶈兘銮峰彇澶栭儴镄勫彉閲,鍙鑳絩eturn杩斿洖锛
浣跨敤镄勯夋嫨鍣ㄥ繀椤诲厛铡诲瑰簲鐣岄溃镄勬带鍒跺彴瀹为獙杩囱兘涓嶈兘阃夋嫨DOM鍐崭娇鐢锛屾瘆濡备含涓沧棤娉曚娇鐢╭uerySelector銆傝繖閲岀敱浜
浜涓灭殑鍒嗙晫闱㈤兘浣跨敤浜唈Query锛屾墍浠ユ垜浠鍙浠ョ敤jQuery锛屾讳箣浠栦滑寮鍙戣兘鐢ㄧ殑阃夋嫨鍣锛屾垜浠閮藉彲浠ョ敤锛屽惁鍒椤氨涓嶅彲浠ャ
鎺ヤ笅𨱒ユ垜浠鐩存帴𨱒ョ埇鍙朜ode.js镄勫畼缃戦栭〉铹跺悗鐩存帴鐢熸垚PDF
镞犺烘偍鏄钖︿简瑙Node.js鍜宲uppeteer镄勭埇铏镄勪汉锻橀兘鍙浠ユ搷浣滐纴璇锋偍涓瀹氢竾鍒嗕粩缁嗛槄璇绘湰鏂囨。骞舵寜椤哄簭镓ц屾疮涓姝
链椤圭洰瀹炵幇闇姹傦细缁欐垜浠涓涓缃戦〉鍦板潃锛岀埇鍙栦粬镄勭绣椤靛唴瀹癸纴铹跺悗杈揿嚭鎴愭垜浠𨱍宠佺殑PDF镙煎纺鏂囨。锛岃锋敞镒忥纴鏄楂樿川閲忕殑PDF鏂囨。
绗涓姝ワ纴瀹夎匩ode.js ,鎺ㄨ崘http://nodejs.cn/download/锛孨ode.js镄勪腑鏂囧畼缃戜笅杞藉瑰簲镄勬搷浣灭郴缁熷寘
绗浜屾ワ纴鍦ㄤ笅杞藉畨瑁呭畬浜哊ode.js钖庯纴 钖锷╳indows锻戒护琛屽伐鍏(windows涓嫔惎锷ㄧ郴缁熸悳绱㈠姛鑳斤纴杈揿叆cmd锛屽洖杞︼纴灏卞嚭𨱒ヤ简)
绗涓夋 闇瑕佹煡鐪嬬幆澧冨彉閲忔槸钖﹀凡缁忚嚜锷ㄩ厤缃,鍦ㄥ懡浠よ屽伐鍏蜂腑杈揿叆 node -v锛屽傛灉鍑虹幇 v10. ***瀛楁碉纴鍒栾存槑鎴愬姛瀹夎匩ode.js
绗锲涙 濡傛灉鎭ㄥ湪绗涓夋ュ彂鐜拌緭鍏node -v杩樻槸娌℃湁鍑虹幇 瀵瑰簲镄勫瓧娈碉纴闾d箞璇锋偍閲嶅惎鐢佃剳鍗冲彲
绗浜旀 镓揿紑链椤圭洰鏂囦欢澶癸纴镓揿紑锻戒护琛屽伐鍏凤纸windows绯荤粺涓鐩存帴鍦ㄦ枃浠剁殑url鍦板潃镙忚緭鍏cmd灏卞彲浠ユ墦寮浜嗭级锛岃緭鍏 npm i cnpm nodemon -g
绗鍏姝 涓嬭浇puppeteer鐖铏鍖咃纴鍦ㄥ畬鎴愮浜旀ュ悗锛屼娇鐢╟npm i puppeteer --save 锻戒护 鍗冲彲涓嬭浇
绗涓冩 瀹屾垚绗鍏姝ヤ笅杞藉悗锛屾墦寮链椤圭洰镄剈rl.js锛屽皢鎭ㄩ渶瑕佺埇铏鐖鍙栫殑缃戦〉鍦板潃镟挎崲涓婂幓(榛樿ゆ槸http://nodejs.cn/)
绗鍏姝 鍦ㄥ懡浠よ屼腑杈揿叆 nodemon index.js 鍗冲彲鐖鍙栧瑰簲镄勫唴瀹癸纴骞朵笖镊锷ㄨ緭鍑哄埌褰揿墠鏂囦欢澶逛笅闱㈢殑index.pdf鏂囦欢涓
TIPS: 链椤圭洰璁捐℃濇兂灏辨槸涓涓缃戦〉涓涓狿DF鏂囦欢锛屾墍浠ユ疮娆$埇鍙栦竴涓鍗旷嫭椤甸溃钖庯纴璇锋妸index.pdf𨰾疯礉鍑哄幓锛岀劧钖庣户缁镟存崲url鍦板潃锛岀户缁鐖鍙栵纴鐢熸垚鏂扮殑PDF鏂囦欢锛屽綋铹讹纴鎭ㄤ篃鍙浠ラ氲繃寰鐜缂栬疟绛夋柟寮忓幓涓娆℃х埇鍙栧氢釜缃戦〉鐢熸垚澶氢釜PDF鏂囦欢銆
瀵瑰簲镀忎含涓滈栭〉杩欐牱镄勫紑钖浜嗗浘鐗囨噿锷犺浇镄勭绣椤碉纴鐖鍙栧埌镄勯儴鍒嗗唴瀹规槸loading鐘舵佺殑鍐呭癸纴瀵逛簬链変竴浜涘弽鐖铏链哄埗镄勭绣椤碉纴鐖铏涔熶细鍑虹幇闂棰桡纴浣嗘槸缁濆ぇ澶氭暟缃戠珯閮芥槸鍙浠ョ殑
const puppeteer = require('puppeteer');
const url = require('./url');
(async () => {
const browser = await puppeteer.launch({ headless: true })
const page = await browser.newPage()
//阃夋嫨瑕佹墦寮镄勭绣椤
await page.goto(url, { waitUntil: 'networkidle0' })
//阃夋嫨浣犺佽緭鍑虹殑闾d釜PDF鏂囦欢璺寰勶纴鎶婄埇鍙栧埌镄勫唴瀹硅緭鍑哄埌PDF涓锛屽繀椤绘槸瀛桦湪镄凯DF锛屽彲浠ユ槸绌哄唴瀹癸纴濡傛灉涓嶆槸绌虹殑鍐呭笔DF锛岄偅涔堜细瑕嗙洊鍐呭
let pdfFilePath = './index.pdf'
//镙规嵁浣犵殑閰岖疆阃夐”锛屾垜浠杩欓噷阃夋嫨A4绾哥殑瑙勬牸杈揿嚭PDF锛屾柟渚挎墦鍗
await page.pdf({
path: pdfFilePath,
format: 'A4',
scale: 1,
printBackground: true,
landscape: false,
displayHeaderFooter: false
});
await browser.close()
})()
鏂囦欢瑙f瀯璁捐
鏁版嵁鍦ㄨ繖涓镞朵唬闱炲父鐝嶈吹锛屾寜镦х绣椤电殑璁捐¢昏緫锛岄夊畾鐗瑰畾镄删ref镄勫湴鍧锛屽彲浠ュ厛鐩存帴銮峰彇瀵瑰簲镄勮祫婧愶纴涔熷彲浠ラ氲繃鍐嶆′娇鐢 page.goto鏂规硶杩涘叆锛屽啀璋幂敤 page.evaluate() 澶勭悊阃昏緫锛屾垨钥呰緭鍑哄瑰簲镄凯DF鏂囦欢锛屽綋铹朵篃鍙浠ヤ竴鍙f皵杈揿嚭澶氢釜PDF鏂囦欢~
杩欓噷灏变笉锅氲繃澶氢粙缁崭简锛屾瘯绔 Node.js 鏄鍙浠ヤ笂澶╃殑锛屾垨璁告湭𨱒ュ畠鐪熺殑浠涔堥兘鑳藉仛銆傝繖涔堜紭璐ㄧ亩鐭镄勬暀绋嬶纴璇锋敹钘
鎴栬呰浆鍙戠粰鎭ㄧ殑链嫔弸锛岃阿璋銆
B. 在Centos7.5上安装wkhtmltopdf、中文字体及相关配置
上传字体文件到/usr/share/fonts/chinese,
然后执行字体缓存更新
fc-list :lang=zh-cn
发现不能正常解析中文字体名
vim /etc/fonts/fonts.conf
在<fontconfig></fontconfig>配置节之间增加以下match标签,增加中文字体解析规则。
配置后,再次检查解析情况
C. ITextRenderer 创建PDF文件,Windows 下Tomcat正常创建,CentOS下的Tomcat就无法正常创建,是什么原因
请确认文件路径是否正确
D. 如何在centos中使用wkhtmltopdf
你好, 1、首先要用yum install mysql命令进行安装MySQL客户端;使用yum install mysql-server命令安装MySQL 服务。 2、运行命令chkconfig --levels 235 mysqld on使MySQL服务可以自动启动,并使用命令/etc/init.d/mysqld start立刻启动MySQL服务 。 3、接着设置MySQL的root密码,运行命令/usr/bin/mysqladmin -u root password 'new-password',其中’new-password’是新设的密码,如123456 。 4、安装完成。
E. centos中怎么看pdf
adobe reader,有linux版本,官方站点可下载。
F. java学习路线
1、java基本语法(1 编写 HelloWorld、2 常量、3 变量、4 数据类型、5 运算符、6 方法、7 流程控制语句、8 IDEA使用:目前企业使用最多开发工具、9 数组)
2、面向对象(1 类、2 对象、3 封装、继承、多态、4 构造器、5super、this、6 接口、抽象类、7 权限修饰符、8 内部类、9 Random、ArrayList、String、Arrays、Math)
3、API(常用API:1 Date、2 DateFormat、3 Calendar、4 System、5 StringBuilde)
4、集合(1 Collection、2 泛型、3 List、4 Set、5 Collections、6 Map、7 HashMap)
5、异常(1 异常体系、2 异常分类、3 声明抛出捕获异常、4 自定义异常)
6、多线程(1 线程概念、2 线程同步、3 Lock、4 线程生命周期、5 线程池)
7、Lambda表达式(1 函数式思想概述、2 Lambda标准格式、3 Lambda语法与注意事项)
8、IO流(1 文件、2 字节流、字符流、3 转换流、高效流)
9、网络编程(1 网络编程三要素、2 Socket原理机制、3 UDP传输、4 TCP传输)
10、数据库(1 mysql、2 jdbc、3 连接池、4 JdbcTemplate )
11、前端技术(1 html5、2 css、3 javascript、4 bootstrap)
12、linux(1 linux安装、2 目录操作、3 文件操作、4 网络操作等)
13、nginx( nginx安装、配置、部署)
14、xml与(1 xml基本语法、2 约束)
15、jsonp( 1 jsoup概述、2 jsoup作用使用、3 xpath)
16、Servlet(1 tomcat、2 request、response、3 cookie、session、4 jsp、el、jstl、Filter)
17、web异步开发(1 jquery3、2 ajax、3 json)
18、redis(1 nosql介绍、2 redis数据类型、3 常用命令、4 jedis)
19、maven(1 maven概念与作用、2 idea集成maven、3 maven常用命令、4 依赖管理)
20、spring(1 spring体系结构、2 spring配置、3 bean管理、 4 IOC/DI、AOP、5 事务管理、6 spring5新特性 )