Ответ кратко - качество спектрами не сравнивают!
Пара ссылок "по теме" :
+ небольшое пояснение чисто по мп3 ( в том числе по спектрам) - порой размазанная картинка до 21000 (при определенных настройках в старых версиях лами легко сделать) означает лишь то, что этот эффект достигнут за счет качества в зоне слышимых частот ... поэтому для понимания вполне достаточно найти качественный исходник и сделать ровно так как рекомендуют аудиофилы, даже не пытаясь заглядывать на картинки спектра ... а еще лучше переходить на более адекватные lossy-варианты - например AAC