[問題] OpenMP 如何確定每顆核心都有用到? hardman1110 PTT批踢踢實業坊

[問題] OpenMP 如何確定每顆核心都有用到?

作者: hardman1110 (笨小孩) 2016-05-20 10:04:35

開發平台(Platform): (Ex: VC++, GCC, Linux, ...)
g++ on Raspberry Pi 3
額外使用到的函數庫(Library Used): (Ex: OpenGL, ...)
OpenCV OpenMP
問題(Question)：
在加速一些追蹤的演算法，在雙核的筆電上以驗證過，速度變1.8倍
但在4核心的樹莓派3上卻也只大約變2倍
餵入的資料(Input)：
可平行化的迴圈(如程式碼)
預期的正確結果(Expected Output)：
速度變為原來的3倍多
錯誤結果(Wrong Output)：
效能不符合預期
程式碼(Code)：(請善用置底文網頁, 記得排版)
vector<double> vSumRadio(sampleBoxNum, 0);
#pragma omp parallel for num_threads(4)
for (int j=0; j< sampleBoxNum; j++)
{
double eSumRadioTmp = 0;
double eTmp1 = 0;
double eTmp2 = 0;
eSumRadioTmp = 0.0f;
for (int i = 0; i<featureNum; i++)
{
double ePosTmp = 0, eNegTmp = 0;
eTmp1 = (sampleValue[i][j]-Pos[i])*(sampleValue[i][j]-Pos[i]);
eTmp2 = (sampleValue[i][j]-Neg[i])*(sampleValue[i][j]-Neg[i]);
ePosTmp = exp(eTmp1/-(2.0f*sigmaPos[i]*sigmaPos[i]
+1e-30))/(sigmaPos[i] + 1e-30);
eNegTmp = exp(eTmp2/-(2.0f*sigmaNeg[i]*sigmaNeg[i]+
1e-30))/(sigmaNeg[i]+1e-30);
eSumRadioTmp += log(ePosTmp + 1e-30) - log(eNegTmp + 1e-30);
}
vSumRadio[j] = eSumRadioTmp;
}
補充說明(Supplement)：
1. 原本沒用 num_threads(4)，用omp_get_thread_num()抓出來的執行緒只有0跟1
2. omp_get_num_procs() 抓出來的核心數確定為4核心

作者: Bencrie 2016-05-20 11:32:00

不是 top 看一下就知道了嗎

作者: hardman1110 (笨小孩) 2016-05-20 12:16:00

top是指?? 如果真的只用到其中兩顆核心那要怎做才能4顆都用到呢?

作者: Bencrie 2016-05-20 12:33:00

/usr/bin/top 啊

作者: james732 (好人超) 2016-05-20 13:36:00

top是linux下的一隻程式，可看cpu使用率等資訊不過我更喜歡htop

作者: nowar100 (拋磚引玉) 2016-05-20 13:44:00

time 看 real 和 user 的比例

作者: hardman1110 (笨小孩) 2016-05-20 15:11:00

謝謝指導還真的不知道top 看了一下CPU使用率，不管我有沒有強制切成4個執行緒，run程式時4顆cpu使用率都會增加到40~50% 原本都5%以內

繼續閱讀

[問題] struct bit fieldgn00618777 [問題] g++ 編譯 class樣板報錯hunandy14 [問題] 關於UVA 無線迴圈TFman [問題]vector<Rect>使用上問題johnnyyushin [問題] 關於減法時的Carry Flaga27417332 [問題] 想問一下關於入門書籍IOP14759 [問題] opencv 多人臉偵測問題s501082001 [問題] 朋友轉學考題目HenryLiKing Re: [心得] C++17 execution policyCaesar08 Re: [心得] C++17 execution policyIKAFIRE