同じアーキテクチャ内の仮想化(たとえばx86で仮想x86VMとか)ならトラップ掛かって遅くなるのはI/Oやリング遷移くらいなので
I/O処理ばかり連発とかしなければほぼ実機と変わらん速度で実行できるけど
全く異なるアーキテクチャの命令をガチでエミュると20〜50倍くらい処理が掛かるので
例えばARMでx86のエミュとなると1.5GHzあってもせいぜい2〜300MHz相当くらいだし、そもそもQEMU自体がx86エミュレータとしてあまりパフォーマンスがよろしくない

x86でARM命令をエミュるのは32bitの頃にIntelが肝いりでやっていたけど、こっちは実機並みで動作していたというからIntel怖ぇ