const OUTPUT_RESERVED_RATIO: f32 = 0.2;
context_window のうち出力用に予約する割合 (まともに決まっていない場合用)。 max_output_tokens が意味をなしていない gpt-4 で適当に決めるための値。
context_window
max_output_tokens