2011-11-01から1ヶ月間の記事一覧

SSEを使って8flops/clockを実現する

この記事の記述には誤りがあることが分かっています.代わりにこちらの記事をご覧ください. SSE(Streaming SIMD Extensions)では,1clockに4つの単精度浮動小数点演算が 可能で,SSE2を使うと1clockに2つの倍精度浮動小数点演算も可能です. しかし,一部の…

gccで指定できるアラインメントのサイズには限界がある

C言語におけるデータのアラインメントについての小ネタです. アラインメント自体については, データ型のアラインメントとは何か,なぜ必要なのか? にとても詳しいです. 問題設定 4バイトの変数を16個の配列で確保するとします. int a[16]; もし各レベル…