並列化

先生から回答を頂きましたよ

id:ange1:20100709で、HPCサマーセミナーに行ったお話を書きましたが、そのときに先生に対して質問した件の回答が頂けました。 …思った以上に大掛かりな話になってしまいましたが。詳しい解説を下さった先生には、本当に感謝です。 話のネタとしては、OpenMP…

インドリ氏のOpenMP記事の問題点〜再び

以前、問題のある記事を書く人ということで、インドリ氏の話を取り上げました*1が、ごく最近氏が新たに投稿した記事OpenMPにおける変数の扱いと並列リダクションも酷い状態なので、指摘したいと思います。 ※「それよりも致命的な…」にて指摘したompの漏れに…

インドリ氏のOpenMP記事の問題点

前々から様々に問題のある記事を書いているインドリ氏ですが。 最近掲載されたCodeZineの連載記事OpenMPのメモリモデルとfork- joinモデル*1 *2にもやっぱり問題がありました、ということで指摘したいと思います。 CodeZineのコメント欄で済ませたい所ですが…

wall clock timeとCPU timeの測定

どうやら、Windowsにはスレッド毎にCPU timeを取得できるGetThreadTimesというAPIがあるらしい。*1 折角なので使ってみました。OpenMPで並列化した場合に、ある処理に焦点をあてて計測してみます。 通常はプロファイラなりのパフォーマンス計測ツールを使う…

くそみそスーパースケール

ところでこいつを見てくれ。どう思う? 1スレッド実行:計測時間4.807秒 2スレッド実行:計測時間1.718秒 ( ×並列度=3.436 ) すごく…スーパースケールです… ※id:ange1:20100514の続きです。

スーパースケールのサンプル

JittaさんのSleepに関する記事のコメント欄で出ていたCPUのキャッシュの話に関してです。 話の続きは、id:Deppi:20100514 になったようです。シングルスレッドのプログラムをスレッド並列化することで、スーパーリニアにスケール ( スーパースケール )、単純…