// speculative_decode_step() 的核心判断floatratio=p_target[token]/p_draft[token];floatu=uniform_random(0.0f,1.0f)