Me modelim, nënkuptojmë hartimin e planit të dyshemesë së një çipi, i cili është rregullimi i nënsistemeve të tij – siç janë bërthamat e tij të CPU-së dhe GPU-së, memorja cache, kontrollorët RAM etj. – në kallëpin e tij të silikonit. Vendosja e qarqeve elektronike minute që përbëjnë këto module mund të ndikojë në konsumin e energjisë dhe shpejtësinë e përpunimit të mikroçipit: instalimet elektrike dhe rutina e sinjalit që nevojiten për t’i lidhur të gjitha kanë shumë rëndësi.
Në një letër që do të botohet këtë javë në Nature, Googlers Azalia Mirhoseini, Anna Goldie dhe kolegët e tyre, përshkruajnë një sistem të thellë të të mësuarit të përforcimit që mund të krijojë plane dyshemeje në më pak se gjashtë orë, ndërsa mund të duhen muaj që inxhinierët njerëzorë dhe mjetet e tyre të automatizuara që të nxjerrin një paraqitje optimale.
Thuhet që Google e ka përdorur këtë sistem AI për të prodhuar planin e dyshemesë së një TPU të gjeneratës së ardhshme. Njësinë e saj të Përpunimit të Tensorit, të cilën gjigandi i internetit përdor për të përshpejtuar rrjetet nervore në motorin e tij të kërkimit, cloud publik, AlphaGo dhe AlphaZero dhe të tjera projekte dhe produkte.
Në fakt, Google po përdor machine-learning software për të optimizuar çipet në të ardhmen që përshpejtojnë machine-learning software.
Për software, kjo nuk është e ndryshme nga luajtja e një loje: ai gradualisht mëson një strategji fituese kur rregullon një mikroprocesor sikur të luante, të themi, një ndeshje Go. Rrjeti nervor është i kënaqur me vendosjen e një çipi që për një njeri mund të duket si një rrëmujë jokonvencionale, por në praktikë, përbërësi ka një avantazh ndaj një pjese të planifikuar nga inxhinierët dhe mjetet e tyre të industrisë. Rrjeti nervor gjithashtu përdor disa teknika të konsideruara dikur nga industria e gjysmëpërçuesve, por të braktisura si rrugë pa krye.
“Metoda jonë u përdor për të hartuar gjeneratën e ardhshme të përshpejtuesve të inteligjencës artificiale të Google dhe ka potencialin për të kursyer mijëra orë përpjekje njerëzore për secilën brez të ri,” shkruajnë Googlers. “Më në fund, ne besojmë se hardueri më i fuqishëm i dizajnuar nga AI do të nxisë përparimet në AI, duke krijuar një marrëdhënie simbioze midis dy fushave.”
Kur dizajnoni një mikroprocesor ose përshpejtues të ngarkesës së punës, zakonisht do të përcaktoni se si funksionojnë nënsistemet e tij në një gjuhë të nivelit të lartë, të tilla si VHDL, SystemVerilog, ose ndoshta edhe Chisel. Ky kod përfundimisht do të përkthehet në diçka të quajtur një listë neto, e cila përshkruan se si një koleksion i blloqeve makro dhe qelizave standarde duhet të lidhen me tela për të kryer funksionet e çipit. Qelizat standarde përmbajnë gjëra themelore si portat logjike NAND dhe NOR dhe blloqet makro përmbajnë një koleksion qelizash standarde ose pajisje të tjera elektronike për të kryer një funksion të veçantë, të tilla si sigurimi i kujtesës së ndezur ose një bërthamë e CPU-së. Blloqet makro janë kështu dukshëm më të mëdha se qelizat standarde.
Më pas, ju duhet të zgjidhni se si ta rregulloni këtë listë neto të qelizave dhe blloqeve makro në fund. Mund të duhen inxhinierë njerëzorë javë me muaj duke punuar me mjete të specializuara të dizajnimit të çipave në shumë përsëritje për të arritur një plan të dyshemesë që optimizohet sipas nevojës për konsum të energjisë, kohën, shpejtësinë etj. Zakonisht, ju do të ndryshonit vendosjen e blloqeve të mëdha makro ndërsa zhvillohet dizajni juaj, dhe i lini mjetet e automatizuara, të cilat përdorin algoritme jo inteligjentë, të vendosin morinë e qelizave standarde më të vogla dhe më pas shpëlajeni dhe përsërisni derisa të bëhet.
Për të shpejtuar këtë fazë të planifikimit të dyshemesë, shkencëtarët e AI të Google krijuan një sistem rrjeti nervor konvolucionar që kryen vendosjen e bllokut makro vetvetiu brenda disa orësh për të arritur një paraqitje optimale; qelizat standarde vendosen automatikisht në boshllëqe nga softueri tjetër. Ky sistem i të mësuarit makinerik duhet të jetë në gjendje të prodhojë një plan ideal për dysheme shumë më shpejt dhe më mirë sesa metoda e mësipërme e rregullimit dhe përsëritjes së një plani dyshemeje me mjetet tradicionale të automatizuara të industrisë dhe njerëzit në kontrolle.
Rrjeti nervor, gradualisht përmirëson aftësitë e tij të vendosjes ndërsa fiton përvojë. Ai përpiqet të vendosë blloqe makro në silikon, me hapësirën në mes të mbushur me qeliza standarde dhe shpërblehet në varësi të bllokimit të rrugës, gjatësisë së ndërlidhjes së telit dhe faktorëve të tjerë. Ky shpërblim përdoret si reagim për të përmirësuar përpjekjen e tij të radhës në vendosjen e blloqeve. Kjo përsëritet derisa softueri të zë vend dhe mund të zbatojë aftësitë e tij në cilindo chip që dëshironi të vendosni, edhe nëse nuk e ka parë një të tillë më parë.
Në punimin e tyre, Googlers thanë se rrjeti i tyre nervor është “i aftë të përgjithësojë midis çipeve -që do të thotë se ai mund të mësojë nga përvoja për t’u bërë më të mirë dhe më të shpejtë në vendosjen e çipeve të reja – duke lejuar që dizajnerët e çipave të ndihmohen nga agjentë artificialë me më shumë përvojë se çdo tjetër. njeriu nuk mund të fitojë ndonjëherë “.
Gjenerimi i një plani dysheme mund të zgjasë më pak se një sekondë duke përdorur një rrjet nervor të para-trajnuar dhe me deri në disa orë rregullim të hollësishëm të rrjetit, softueri mund të përputhet ose të mundë një njeri në hartimin e planit të dyshemesë, sipas letrës, në varësi të cilën metrikë e përdorni. Rrjeti nervor tejkaloi inxhinierët njerëzorë të cilët punuan në një përshpejtues të mëparshëm TPU për sa i përket kohës së sinjalit, përdorimit të energjisë, zonës së silikonit dhe / ose sasisë së instalimeve elektrike të nevojshme, në varësi të makro blloqeve të përfshira.
Për shembull, një çip i gjeneratës së mëparshme TPU u paraqit nga inxhinierë njerëzorë, dhe kur rrjeti nervor bëri një plan për dyshemenë për të njëjtin komponent, programi ishte në gjendje të shkurtonte sasinë e instalimeve elektrike të nevojshme në gyp (duke zvogëluar gjatësinë e telit nga 57.07 m në 55.42m.) Në mënyrë të ngjashme, rrjeti nervor zvogëloi gjatësinë e telit në një bërthamë të CPU-së Ariane RISC-V kur gjeneron planin e saj të dyshemesë. Sistemi u trajnua, pjesërisht, duke përdorur modelet e mëparshme të TPU.
Ne vërejmë se pasi rrjeti nervor i Googlers kishte vendosur një TPU të gjeneratës së ardhshme, dizajni ende duhej të ndryshohej nga ekspertët për të siguruar që përbërësi në të vërtetë do të funksiononte ashtu siç ishte menduar – njerëzit dhe mjetet e tyre të zakonshme të software ishin të nevojshëm për biznesin e ngushtë të kontrollimi i përhapjes së sinjalit të orës, etj. Ky hap do të ishte ende i nevojshëm edhe nëse TPU ishte planifikuar nga njerëzit dhe jo një rrjet nervor.
“Metoda jonë u përdor në shiritin e produkteve të një Google TPU të kohëve të fundit”, shkruajnë Googlers. “Ne automatizuam plotësisht procesin e vendosjes përmes PlaceOpt, në të cilën pikë projekti iu dërgua një pale të tretë për optimizimin pas vendosjes, duke përfshirë kursin e detajuar, sintezën e pemës së orës dhe optimizimin pas orës.”
Ne gjithashtu vërejmë se vendosja e rrjetit nervor për TPU të gjeneratës së ardhshme të regjistruar ishte, sipas gazetës, “e krahasueshme me modelet manuale”, dhe me një hap të mëtejshëm të rregullimit të mirë që optimizonte orientimin e blloqeve, gjatësia e telit ishte shkurtohet me 1.07 për qind. I gjithë procesi i planifikimit të dyshemesë zgjati vetëm tetë orë. Pra, me sa duket, ose Google mund të përdorë rrjetin e tij nervor për të dalë më mirë se njerëzit ose pak a shumë përputhen me ta, dhe mund ta bëjë këtë në orë dhe jo ditë, javë ose muaj.
Dokumenti i tyre përfundon:
Ne tregojmë se metoda jonë mund të gjenerojë plane dyshemeje me çipa që janë të krahasueshme ose superiore me ekspertët njerëzorë në më pak se gjashtë orë, ndërsa njerëzve u duhen muaj për të prodhuar plane dyshemeje të pranueshme për përshpejtuesit modernë. Metoda jonë është përdorur në prodhim për të hartuar gjeneratën e ardhshme të Google TPU.
Vitin e kaluar, Google nxori një parathënie të një letre të ngjashme që përshkruante përdorimin e mësimit të përforcimit për skicimin e skedarëve. Google ka punuar në hartimin e çipave me fuqi AI, të paktën që nga viti 2017. Ky punim i fundit nuk është vetëm një përpunim i botuar nga revista i asaj pune të mëparshme, ai gjithashtu zbulon që softueri është përdorur për të hartuar një TPU të gjeneratës së ardhshme.