導航:首頁 > 編程語言 > php論文查重

php論文查重

發布時間:2023-07-08 00:23:56

Ⅰ PHP做一個簡單的類似論文查重的功能

思路是可以的:

//步驟一,分句,把原文$text按標點符號分為句子存入數組$arr,只保存長度15個字元以上的句子
//本步驟應該沒有難度

//步驟二,判斷數組$arr中的每個句子在現有資料庫中是否匹配
foreach ($arr as $str){
if CheckS($str) 標記句子$str;
}

//函數,在資料庫裡面匹配指定的句子,返回最大匹配的子串
function CheckS($s){
$n=strlen($s);//考慮漢字編碼,可能需要使用多位元組的函數,這里只是含義描述
for ($i=0;$i<=$n-15;$i++){
$ss=left($s,$n-$i);//前$n-$i(全長、少1個、少2個、15個)個字元
$sql="select count(*) from 資料庫 where 論壇內容 like '%$ss%'";
if 資料庫中的論文正文存在字元串$ss then return $ss;
$ss=right($s,$n-$i);//後$n-$i(全長、少1個、少2個、15個)個字元
$sql="select count(*) from 資料庫 where 論壇內容 like '%$ss%'";
if 資料庫中的論文正文存在字元串$ss then return $ss;
}
return "";//返回空串,表示無匹配
}

說明,資料庫中的論文要進行整理,整理為匹配模板,刪除多餘的空格、回車、換行,把所有的表達符號替換為空格,這樣資料庫裡面的論文模板就是空格分開的句子。

閱讀全文

與php論文查重相關的資料

熱點內容
胸7椎體輕度壓縮 瀏覽:108
sk5伺服器什麼意思 瀏覽:554
什麼是廊坊交警app 瀏覽:294
衣櫃造價演算法 瀏覽:984
默認的web伺服器地址 瀏覽:694
單片機與發光二極體 瀏覽:320
pythonwebmodule 瀏覽:328
空調壓縮機不停了 瀏覽:115
python序列怎麼取 瀏覽:199
線上資料庫加密怎麼查詢 瀏覽:794
js中數據加密 瀏覽:470
穴pdf 瀏覽:548
阿里雲伺服器雲資料庫還需要嗎 瀏覽:146
在程序設計中常用的演算法有哪些 瀏覽:977
為什麼蘇州公積金app一直維護 瀏覽:805
有ip地址但是dhcp伺服器 瀏覽:446
三星手機加密中斷怎麼回事 瀏覽:538
訓練模型init源碼 瀏覽:840
程序編譯是誰的功能 瀏覽:505
qq收藏怎樣設置加密 瀏覽:291