Llama 4 FM 推理基准测试:GPU vs AWS 自研芯片对比 GPU 实例(p5、p4d、g6e)和 AWS 自研芯片(Trainium2、Inferentia2)在 vLLM 基础 Llama 4 模型服务中的性能和成本效率的基准测试