cnn (evrişimli sinir ağları, görüntü sınıflandırma ve algılama demek, yolov5, sam ) le web kamerada daha önce karşılaştığı kişileri tanımlayacak,
bunları CogVLM ve llava ile llm modellerinin algılayabileceği kelimelere dönüştürecek,
hayal kurmak istediği zaman stable diffusion, flux ı tetikleyecek ve görüntüleri llava ile yeniden düz metin olarak anımsayacak,
stylegan la rüya görecek,
chatterbox, kokoro ile konuşacak,
duygusal durumuna göre farklı ses tonları kullanacak,
acesteple şarkı mırıldanacak,
nomic-embed-text le vektör hafızaya sahip olacak.
arkaplanda nasıl çalıştığını anlamadığınız chatgpt nin verileri nasıl yorumladığını da özetlemiş oldum!
kamera sürekli açıksa verdiğiniz kişiliğe,
geniş vektör hafızasına bağlı olarak,
sizi senelerdir tanıdığı için eşya düzeninize,
giyim kuşamınıza,
görünümünüze dair anlık, spontane yorumlar bile yapabilir.