Llama 4 FM 服务基准测试:GPU vs AWS Custom Silicon基于 vLLM 的 Llama 4 模型服务中 GPU 实例(p5、p4d、g6e)和 AWS 定制芯片(Trainium2、Inferentia2)的性能及成本效率比较基准测试