真・SSEを使って8flops/clockを実現する
カーネル/VM Advent Calendar の34日目として書きます.記事の内容自体はこのイベントと関係ありませんので,どなたでもお楽しみ下さいませ. 今回は 自分の前回の記事 で見つけた誤りを訂正しつつ,Intelの一部CPUがサポートするSSE(Streaming SIMD Extensions)命令により1clockで8個の単精度浮動小数点演算を行なう方法…