من همیشه مجذوب فناوری بوده ام. از بیوتکنولوژی گرفته تا فناوری آینده و همه چیز بین آنها ، من می خواستم همه چیز را امتحان کنم و سپس آن را بشکنم تا درک کند که چگونه کار می کند. با این حال ، اگر 30 سال پیش به من گفته بودید که یک روز ، یک دستگاه کوچک دستی قادر به ایجاد تصویری از هوای ظریف و تقاضای متن خواهد بود ، من به آن اعتقاد نداشتم.
با این حال ، ما در اینجا هستیم و تلفن شما می تواند آنچه را که شما می گویید از طریق هوش مصنوعی به یک تصویر تبدیل کنید. این اغلب یک تصویر عالی نیست (و می تواند یک هرج و مرج مشکل ساز باشد) ، اما هنوز هم یک قطعه ماشین برای انجام کاری است کاربر به انسان نیاز داشته باشد. او هنوز هم این کار را می کند. از نظر فنی ، افراد زیادی برای گذراندن زمان زیادی طول می کشد.
کار قبل از استفاده از آن اتفاق می افتد
هوش مصنوعی مدرن با یک شبکه عصبی کار می کند. ممکن است متوجه شوید که کلمه عصبی وسیله ای است که مربوط به سیستم عصبی است و این تصادفی نیست. رایانه ها ارگانیک نیستند و سیستم عصبی ندارند ، اما می تواند روند و عملکرد را به روش خاص خود شبیه سازی کند. اینجاست که همه چیز شروع می شود: با یک مش عصبی بدن.
این تخصص در توانایی تشخیص الگوهای و چیزها را دارد – نه به همان روشی که ما انجام می دهیم ، بلکه به روشی شگفت انگیز ، حتی اگر تقریباً مانند چشم انسان و مغز پیچیده نباشد.
یک ماکت دقیق از هر آنچه را که آموخته اید یا می توانید آن را تشخیص دهید ، به خاطر بسپارید. شما می دانید که پیراهن بدون در نظر گرفتن رنگ آن پیراهن است ، زیرا ذهن شما می داند پیراهن چیست. برای آشنایی با یکی از پیراهن های جهان لازم نیست.
هوش مصنوعی کاری مشابه انجام می دهد. وی از پردازش صدها میلیون عکس آموزش دیده بود و هرکدام توضیحی دارد که دقیقاً نشان می دهد تصویر چیست. این را به عنوان مثال در نظر بگیرید:
این یک پنیرهای همبرگر و یک طرف سیب زمینی سرخ کرده است. اما می توان با جزئیات بیشتری توضیح داد:
این تصویری از غذا است. این ماده حاوی یک سینه همبرگر با دو قطعه بیکن و پنیر سوئیسی است و یک کیک مرطوب به نظر می رسد. خطوط کوره قابل مشاهده روی گوشت و برخی از آب میوه های موجود در کیک وجود دارد. همچنین یک سبد سیمی وجود دارد که ماکت از ماهیتابه عمیق است که حداقل 13 قطعه از آن برش های سیب زمینی به نظر می رسد. آنها سرخ شدند و حداقل یکی از آنها کمی سوخته بود.
در یک صفحه متفاوت ، غذاهای ناشناخته با یک بشقاب کوچک کره وجود دارد که پر از مرکز نیست. یک ظرف مربع کوچک با چنگال نیز وجود دارد ، چاقویی که روی آن قرار گرفته و یک فنجان جزئی پر از مایع ناشناخته است. میز چوب قهوه ای است و بازتاب هایی در مورد نور قرمز و زرد در نزدیکی بالا وجود دارد.
اینگونه است که تصاویر را باید توصیف کرد زیرا در الگوریتم آموزش هوش مصنوعی تغذیه می شود. تمام جزئیات مورد تجزیه و تحلیل قرار می گیرند ، و هیچ چیز مهم نیست زیرا رایانه هایی که “ظاهر” را انجام می دهند به دنبال الگویی در سر و صدای بصری تصویر هستند.
هنگام آموزش هوش مصنوعی ، همه جزئیات مهم هستند ، حتی مواردی که به نظر می رسد مهم هستند.
در نهایت ، این مدل قادر به ادعای و ایجاد الگوهای نویز مناسب برای ایجاد یک تصویر خواهد بود زیرا حاوی مقدار مناسب از نوع مناسب داده ها است. همه چیز مربوط به یک تحلیل مربوطه است ، نه فقط کیک پنیر همبرگر که من و من متوجه آن می شویم.
با تجزیه و تحلیل داده های کافی ، می تواند به عنوان یک مسیر یا مجموعه ای از راهنمایی ها برای ایجاد یک تصویر جدید که درخواست کاربر را برآورده می کند ، خدمت کند. قطعات و قطعاتی را از تصاویری که قبلاً دیدید ، نمی گیرد و مانند یک معما جمع می شود. این به سادگی ایجاد الگوهای سر و صدای بصری است. با آموزش کافی ، این الگوهای به عنوان یک تصویر به پایان می رسد.
این همچنین دلیل اشتباه برخی از مدل ها را توضیح می دهد. هوش مصنوعی فقط می تواند بر اساس آنچه آموزش دیده است ایجاد شود. اگر در حال آموزش با استفاده از 100،000،000 عکس از سگ های سیاه هستید اما هرگز شامل یک تصویر قهوه ای نیست ، هوش مصنوعی بدون توجه به نحوه تلاش برای گفتن آن ، نمی تواند یک تصویر سگ قهوه ای ایجاد کند.
تعصب وجود دارد زیرا هوش مصنوعی در داده های وب آموزش داده می شود ، و برخی از موارد اغراق آمیز در حالی که برخی دیگر نشان داده می شوند ، اغراق آمیز هستند. این باعث می شود او به نتایج نتایج برسد زیرا ، همانطور که بحث کردیم ، هوش مصنوعی می تواند آنچه را که فقط آموزش دیده است ، دوباره ایجاد کند. من از هوش مصنوعی می خواهم که تصویری از دانشمندی که پیراهن خود را با پرچم کرواسی و کفش های ورزشی آبی پوشیده است ، ایجاد کند ، و احتمالاً پزشک به دلیل نحوه نمایش داده های آموزش ، یک قفقاز است.
شما می توانید تصویری از دنیای سیاه با همان پیراهن و کفش که روی صندلی چرخدار نشسته است سفارش دهید و به احتمال زیاد آن را با یک ارائه می دهد. همانطور که در طول آموزش ، شرح خوبی از علاقه زیاد است.
هوش مصنوعی به پیشرفت خود ادامه خواهد داد و تصاویر بخشی از آن خواهند بود. محققان نه تنها با تدوین الگوریتم و استفاده از داده های نماینده موانع بسیاری دارند ، بلکه سعی می کنند از نظر اخلاقی در مورد تعصب ذاتی و داده های آموزش ناقص کار کنند.
ما فقط در چند سال مسیری طولانی را طی کرده ایم و همه چیز به دنبال کند شدن به زودی نیست.
منبع: https://www.androidcentral.com/apps-software/ai/how-does-ai-create-an-image
تحریریه بیزنس موبایل