PR

Gemini Nano Banana 拡大,補正を試してみる

10年以上前(多分もっと前)の低解像度かつサイズの小さな画像の拡大。
様々な画像ソフト、拡大ソフト、クラウドサービスを使って、ましにはなっても、実際に使える画像にはならなかったもの。
見事な仕上がりだった。
で、調子に乗って続けて何枚か処理してみる。
表面の模様が違う、全体の形状が違う、部分的に形状が違う、色が大きく違う。そうか、そういうことか。元画像に補正の処理が施されているわけでは無い。新たに別の画像が生成されている。はまれば見事に綺麗な画像になる、というか、元画像が補正されたかのような新たな画像が生成される、と表現するべきだろう。プロンプトで補ったり、修正を指示したりしてみる。修正を指示しても、オウム返しの言葉で、「○○○○・・ しました」と返答が来ても、何も変わっていない。プロンプトで言葉を足しても、やはりコピペ回答が来ても生成される画像は代わり映えしないことの方が多い。ここで補足しておくと、うまく修正出来たり、プロンプトの指示通りはまることもあるので、使える画像になるものも出来る。時間をおいて、同じことを新たなチャットで試してみると、うまくはまることもある。妥協できる範囲のものも含めれば、画像処理ソフトで時間をかけるより、いいものが時短で仕上がる。
言葉の返答と、生成される画像とは、別もの。言葉の返答は、あきらかに通常のというかより単純なLLMで生成された言葉。
プログラミング、バイブコーディングする時と同様に考え作業すればいい。
大規模言語モデル LLM (というのかどうか分からないが) で、実現されている機能だと思われる。
決して否定しない、むしろ使っていくことだろうと思う。

コメント