<span id="plx27"><var id="plx27"></var></span>
<dfn id="plx27"><var id="plx27"></var></dfn>
  • <span id="plx27"><code id="plx27"><input id="plx27"></input></code></span>
    <menu id="plx27"></menu><menuitem id="plx27"><thead id="plx27"><input id="plx27"></input></thead></menuitem>
  • <label id="plx27"><code id="plx27"></code></label>
    <label id="plx27"><button id="plx27"></button></label>

    計(jì)算機(jī)組成原理(第四版)課件10

    上傳人:jkl****17 文檔編號(hào):248226241 上傳時(shí)間:2024-10-22 格式:PPT 頁數(shù):45 大小:509.50KB
    收藏 版權(quán)申訴 舉報(bào) 下載
    計(jì)算機(jī)組成原理(第四版)課件10_第1頁
    第1頁 / 共45頁
    計(jì)算機(jī)組成原理(第四版)課件10_第2頁
    第2頁 / 共45頁
    計(jì)算機(jī)組成原理(第四版)課件10_第3頁
    第3頁 / 共45頁

    下載文檔到電腦,查找使用更方便

    15 積分

    下載資源

    還剩頁未讀,繼續(xù)閱讀

    資源描述:

    《計(jì)算機(jī)組成原理(第四版)課件10》由會(huì)員分享,可在線閱讀,更多相關(guān)《計(jì)算機(jī)組成原理(第四版)課件10(45頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

    1、單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,第十章安騰高性能處理機(jī)體系結(jié)構(gòu),返回,第十章安騰高性能處理機(jī)體系結(jié)構(gòu),高性能處理機(jī)體系結(jié)構(gòu)的演變,安騰體系結(jié)構(gòu)的基本設(shè)計(jì)思想,安騰指令系統(tǒng)結(jié)構(gòu),指令級(jí)并行機(jī)制,雙核安騰處理機(jī)的組成,10.1,高性能處理機(jī)體系結(jié)構(gòu)的演變,一、,IA,體系結(jié)構(gòu)的歷史演變,二、英特爾,64,位處理機(jī)的兩種體系結(jié)構(gòu),10.1,高性能處理機(jī)體系結(jié)構(gòu)的演變,一、,IA,體系結(jié)構(gòu)的歷史演變,IA32,體系結(jié)構(gòu):,IA32,家族中的第一款,32,位微處理機(jī)流水技術(shù),IA32,體系結(jié)構(gòu)仍是基于,CISC,架構(gòu)的處理機(jī)。,Pentium,體系

    2、結(jié)構(gòu),:CISC,外殼加,RISC,內(nèi)核的結(jié)構(gòu),10.1,高性能處理機(jī)體系結(jié)構(gòu)的演變,二、英特爾,64,位處理機(jī)的兩種體系結(jié)構(gòu),1,、,64T(,英特爾,64):,基于顯式并行指令計(jì)算,EPIC,(,Explicitly Parallel Instruction Computing,)技術(shù)的,IA64,體系結(jié)構(gòu),不與,IA32,指令系統(tǒng)的兼容性。,2,、安騰體系結(jié)構(gòu),:,與,IA32,指令系統(tǒng)的兼容性。,10.2,安騰體系結(jié)構(gòu)的基本設(shè)計(jì)思想,安騰體系結(jié)構(gòu)脫離了,IA32 CISC,體系結(jié)構(gòu)的束縛,但并沒有完全照搬,RISC,處理機(jī)的設(shè)計(jì)思想。,EPIC,既不是,RISC,,也不是,CISC,,

    3、而是一種吸收了,CISC,和,RISC,兩者長(zhǎng)處的全新的體系結(jié)構(gòu)。主要體現(xiàn)在以下幾個(gè)方面:,顯式并行指令計(jì)算,(EPIC),技術(shù),超長(zhǎng)指令字,(VLIW),技術(shù),分支推斷技術(shù),推測(cè)技術(shù),軟件流水技術(shù),寄存器堆棧技術(shù),10.2,安騰體系結(jié)構(gòu)的基本設(shè)計(jì)思想,1,、顯式并行指令計(jì)算,(EPIC),技術(shù),安騰的指令中設(shè)計(jì)了屬性字段,用于指明哪些指令可以并行執(zhí)行。這些屬性信息并不是在指令執(zhí)行過程中由處理機(jī)判定后獲得的,而是由編譯程序在編譯時(shí)通過對(duì)源代碼的分析獲取指令級(jí)的并行性信息,并填寫到執(zhí)行代碼中。這就是所謂顯式并行的概念。,EPIC,技術(shù)則充分利用現(xiàn)代編譯程序強(qiáng)大的對(duì)程序執(zhí)行過程的調(diào)度能力,由專用的

    4、,EPIC,編譯器首先分析源代碼,根據(jù)指令之間的依賴關(guān)系最大限度地挖掘指令級(jí)的并行性,從而確定哪些指令可以并行執(zhí)行,然后把并行指令放在一起并重新排序,提取并調(diào)度其指令級(jí)的并行,并將這種并行性通過屬性字段“顯式”地告知指令執(zhí)行部件。,10.2,安騰體系結(jié)構(gòu)的基本設(shè)計(jì)思想,2,、超長(zhǎng)指令字,(VLIW),技術(shù),超長(zhǎng)指令字,(VLIW),技術(shù)是提高計(jì)算機(jī)系統(tǒng)并行性的有效手段。,VLIW,系統(tǒng)中指令字長(zhǎng)可多達(dá)幾百位,編譯器經(jīng)過優(yōu)化,能將多條能夠并行執(zhí)行的指令合并成一個(gè)具有多個(gè)操作碼的超長(zhǎng)指令字,控制多個(gè)獨(dú)立的功能部件工作。,EPIC,是基于超長(zhǎng)指令字的設(shè)計(jì)。,通過將多條指令放入一個(gè)超長(zhǎng)指令字,能有效提

    5、高處理機(jī)內(nèi)各個(gè)執(zhí)行部件的利用率。,10.2,安騰體系結(jié)構(gòu)的基本設(shè)計(jì)思想,3,、分支推斷技術(shù),技術(shù)能將傳統(tǒng)的“,ifthenelse,”,分支結(jié)構(gòu)轉(zhuǎn)變?yōu)闊o分支的順序,/,并行代碼,以避免由于錯(cuò)誤預(yù)測(cè)分支而付出代價(jià)。當(dāng)處理機(jī)在運(yùn)行中遇到分支時(shí),它并不是進(jìn)行傳統(tǒng)的分支預(yù)測(cè)并選擇可能性最大的一個(gè)分支執(zhí)行,而是按分支的所有可能的后續(xù)路徑開始并行執(zhí)行多段代碼并暫存各段代碼的執(zhí)行結(jié)果,直到處理機(jī)能夠確認(rèn)分支轉(zhuǎn)移與否的條件是真是假時(shí),處理機(jī)再把應(yīng)該選擇的路徑上的指令執(zhí)行結(jié)果保留下來。,采用了推斷技術(shù)后,原有的轉(zhuǎn)移指令被轉(zhuǎn)換成條件執(zhí)行指令。原有的轉(zhuǎn)移指令的所有的分支都被并行執(zhí)行,無論哪條分支將被命中,都不會(huì)出現(xiàn)

    6、流水線斷流現(xiàn)象,故消除了因分支預(yù)測(cè)失誤而重新裝載流水線導(dǎo)致的低效率現(xiàn)象。更進(jìn)一步,以前由于程序分支和指令依賴等因素不能并行執(zhí)行的許多指令現(xiàn)在完全可以并行執(zhí)行,從而提高了處理機(jī)的執(zhí)行效率。,10.2,安騰體系結(jié)構(gòu)的基本設(shè)計(jì)思想,4,、推測(cè)技術(shù),推測(cè)技術(shù),包括控制推測(cè)和數(shù)據(jù)推測(cè),以減少存儲(chǔ)器訪問響應(yīng)時(shí)間的影響。,控制推測(cè)技術(shù)和數(shù)據(jù)推測(cè)技術(shù)允許提前執(zhí)行從內(nèi)存單元至通用寄存器的取數(shù)指令。當(dāng)程序中有分支時(shí),控制推測(cè)技術(shù)將位于分支指令之后的取數(shù)指令提前若干周期執(zhí)行,以此消除訪存延時(shí),提高指令執(zhí)行的并行度。而數(shù)據(jù)推測(cè)技術(shù)則用于解決提前取數(shù)指令后的數(shù)據(jù)相關(guān)性問題。,推測(cè)技術(shù)避免了,cache,命中失敗而導(dǎo)致訪

    7、存延遲的損失,消除了因處理機(jī)空閑而導(dǎo)致的并行性降低的缺憾。,10.2,安騰體系結(jié)構(gòu)的基本設(shè)計(jì)思想,5,、軟件流水技術(shù),安騰體系結(jié)構(gòu)提供了很強(qiáng)的硬件支持,使循環(huán)執(zhí)行過程中一次循環(huán)的代碼執(zhí)行與下一次循環(huán)代碼的執(zhí)行在時(shí)間上部分重疊,也即下一個(gè)循環(huán)步可以在上一個(gè)循環(huán)步結(jié)束前開始執(zhí)行。,安騰體系結(jié)構(gòu)引入了新機(jī)制來支持軟件流水,包括自動(dòng)寄存器重命名、推斷執(zhí)行和特殊的循環(huán)終止指令。因此,安騰處理機(jī)能夠通過旋轉(zhuǎn)寄存器機(jī)制為每個(gè)循環(huán)步提供自己的寄存器,并且不需要把循環(huán)擴(kuò)展開來。,安騰體系結(jié)構(gòu)中硬件對(duì)編譯器管理軟件流水線的支持使得編譯器能夠生成精簡(jiǎn)的代碼,以高度并行的方式實(shí)現(xiàn)循環(huán)操作。,10.2,安騰體系結(jié)構(gòu)的基

    8、本設(shè)計(jì)思想,6,、寄存器堆棧技術(shù),安騰處理機(jī)利用,128,個(gè)通用寄存器中的,96,個(gè)堆棧寄存器實(shí)現(xiàn)寄存器堆棧,并在處理機(jī)內(nèi)部設(shè)置一個(gè)寄存器堆棧引擎,RSE,來管理寄存器堆棧。當(dāng),96,個(gè)堆棧寄存器不夠用時(shí),寄存器堆棧引擎能夠自動(dòng)將寄存器堆棧與內(nèi)存儲(chǔ)器對(duì)接,將寄存器堆棧溢出的數(shù)據(jù)轉(zhuǎn)移到內(nèi)存儲(chǔ)器中保存,或在寄存器堆棧彈出數(shù)據(jù)時(shí)執(zhí)行反向操作。這樣,編譯器將看到一個(gè)容量沒有限制的寄存器堆??臻g。,10.3,安騰指令系統(tǒng)結(jié)構(gòu),一、執(zhí)行單元與指令類型,為提高并行處理能力,安騰處理機(jī)內(nèi)部設(shè)置了多個(gè)執(zhí)行單元。這些執(zhí)行單元被分為四類:,I,單元,:,整數(shù)執(zhí)行單元,用于執(zhí)行整數(shù)算術(shù)運(yùn)算、邏輯運(yùn)算、移位和比特處理等

    9、指令,以及,32,位數(shù)據(jù)和指針操作。,M,單元,:,存儲(chǔ)器執(zhí)行單元,用于執(zhí)行通用寄存器、浮點(diǎn)寄存器和存儲(chǔ)器之間的取數(shù)(,load),指令、存數(shù),(store),指令以及某些整數(shù),ALU,運(yùn)算指令。,B,單元,:,轉(zhuǎn)移執(zhí)行單元,用于執(zhí)行轉(zhuǎn)移分支類指令。,F,單元,:,浮點(diǎn)執(zhí)行單元,用于執(zhí)行浮點(diǎn)運(yùn)算指令。,相應(yīng)地,安騰指令系統(tǒng)中的所有指令被分成六種類型,每種指令使用一種或多種執(zhí)行單元。,10.3,安騰指令系統(tǒng)結(jié)構(gòu),二、安騰寄存器結(jié)構(gòu),與,RISC,體系結(jié)構(gòu)類似,安騰體系結(jié)構(gòu)大量使用寄存器操作,;,見下一頁圖,只有取數(shù),load,和存數(shù),store,指令才能夠訪問內(nèi)存,所有其他指令都在寄存器上操作。

    10、,在以安騰為基礎(chǔ)的處理機(jī)內(nèi),用戶可直接使用的寄存器數(shù)量甚至大大超過了主流,RISC,處理機(jī)。,一方面可以加快數(shù)據(jù)存取的速度,減少訪存延遲,另一方面可以更好地支持并行操作。,安騰的主要寄存器,10.3,安騰指令系統(tǒng)結(jié)構(gòu),三、安騰指令格式,典型指令格式,:,安騰的每條指令占,41,位。,對(duì)于寄存器操作數(shù),需要,7,位選擇,128,個(gè)通用寄存器或浮點(diǎn)寄存器。故一條典型的,RRR,型安騰指令需要,21,位來標(biāo)識(shí)兩個(gè)源寄存器操作數(shù)和一個(gè)目標(biāo)寄存器操作數(shù)。,大多數(shù)指令還需要一個(gè),6,位字段選擇,64,個(gè)推斷寄存器之一,用于支持推斷執(zhí)行、軟件流水等功能。,指令束格式安騰體系結(jié)構(gòu)采用超長(zhǎng)指令字技術(shù),利用集束指

    11、令合成;,10.3,安騰指令系統(tǒng)結(jié)構(gòu),指令組,指令組將相互之間沒有讀后寫相關(guān),寫后寫相關(guān),可以并行執(zhí)行的一組指令集合。,指令束模版,模版字段正是為實(shí)現(xiàn),EPIC,的設(shè)計(jì)思想服務(wù)的:一方面,編譯器可以通過,5,位模版字段指明每個(gè)指令槽中的指令使用哪一個(gè)執(zhí)行單元;另一方面,編譯器可以通過模板字段明確給出指令束內(nèi)或指令束間的依賴關(guān)系。,10.3,安騰指令系統(tǒng)結(jié)構(gòu),四、安騰匯編語言格式,qpMnemonic,.Comp1.Comp2,dest,=,src,mnemonic,為指令助記符。,dest,為目標(biāo)操作數(shù),指明存放運(yùn)算結(jié)果的寄存器。,src,為源操作數(shù),給出若干個(gè)寄存器操作數(shù)或立即數(shù)。,qp,選

    12、擇,64,個(gè)推斷寄存器之一。在指令執(zhí)行時(shí),如果選定的一比特推斷寄存器的當(dāng)前值為,1,,則該指令的執(zhí)行結(jié)果最終會(huì)被硬件采用;否則,該指令的執(zhí)行結(jié)果將被硬件放棄。對(duì)于不需要推斷寄存器的指令,在機(jī)器指令中將默認(rèn)指定推斷寄存器,0,,該寄存器的值固定為,0,。因此,所有的指令都可以看作是條件執(zhí)行的。,.comp1.Comp2,為指令完成符,用于進(jìn)一步限定指令所需完成的操作。,例,1:,下面給出一些匯編指令,add,rl,=r2,,,r3 /,簡(jiǎn)單指令,:r2+r3=r1,(P4)add,rl,=r2,,,r3 /,推斷指令,指定推斷寄存器,4,add r1=r2,,,r3,/,立即尋址指令,cmpeq

    13、,P3,,,P5=0,,,r4 /,帶指令完成符的指令:將,r4,寄存器的值與,0,比較,若相等則置推斷寄存器,P3,為,1,,,P5,為,0,;否則置推斷寄存器,P3,為,0,,,P5,為,1,ld8 r1=,r7,/,從寄存器,r7,指向的存儲(chǔ)器空間讀取連續(xù),8,個(gè)字節(jié),裝入寄存器,r1,add r6=r9,,,r8,;,/,與上一條指令不存在相關(guān)性,故可放在一個(gè)指令組中,sub r3=r1,r4 /,第一條指令的目標(biāo)操作數(shù)是本指令的源操作數(shù),故需重新開始一個(gè)指令組,st8,r6,=r10 /,將寄存器,r10,的內(nèi)容存入寄存器,r6,指向的存儲(chǔ)器單元,10.4,指令級(jí)并行機(jī)制,一、推斷執(zhí)

    14、行技術(shù),1,、分支對(duì)系統(tǒng)性能的影響分支是在兩個(gè)指令序列中根據(jù)判定條件選擇其中一個(gè)序列執(zhí)行。為了判定最終選擇哪一個(gè)指令序列執(zhí)行,必須等待一些條件判斷指令的執(zhí)行結(jié)果。,指令執(zhí)行一旦遇到分支轉(zhuǎn)移,在執(zhí)行判定操作之前,多個(gè)功能部件由于無法確定程序的執(zhí)行方向而空閑等待,使系統(tǒng)性能明顯下降。,分支預(yù)測(cè)并不能充分利用處理機(jī)流水線的功能部件,10.4,指令級(jí)并行機(jī)制,2,、安騰的推斷技術(shù)原理,推斷技術(shù)處理分支的方法是利用多個(gè)功能部件并行執(zhí)行各個(gè)分支,然后根據(jù)判定結(jié)果選取某一分支的運(yùn)行結(jié)果,因而可消除大部分的轉(zhuǎn)移,使得整個(gè)系統(tǒng)的運(yùn)行速度得到提高。,采用顯式并行指令計(jì)算技術(shù)的安騰處理機(jī)將處理機(jī)的多個(gè)功能部件的并行

    15、處理能力與編譯器的強(qiáng)大功能相結(jié)合,允許在編譯時(shí)讓編譯器對(duì)程序進(jìn)行優(yōu)化,消除轉(zhuǎn)移,提高效率。,安騰處理機(jī)的指令系統(tǒng)允許在每條指令中都指定一個(gè)推斷寄存器。,10.4,指令級(jí)并行機(jī)制,3,、,推斷執(zhí)行的實(shí)現(xiàn),例,2,考察下面的一個(gè)典型的,if-then-else,結(jié)構(gòu):,If,(,x=0),then m=m+1,else m=m-1,在傳統(tǒng)的超標(biāo)量流水線體系結(jié)構(gòu)中,完成上述判斷通常要首先安排一條比較語句,將,x,與,0,進(jìn)行比較。得到比較結(jié)果后,再選擇執(zhí)行,then,分支或,else,分支。,相應(yīng)的匯編語句大致如下所示:,cmp,x,,,0;,比較,x,和,0,je,L1;,若相等則轉(zhuǎn)移至標(biāo)號(hào),L1

    16、sub m,1,;,m=m-1,jmp,L2,;無條件轉(zhuǎn)移至標(biāo)號(hào),L2L1,:,add m,,,1,;,m=,m+l,L2,:,10.4,指令級(jí)并行機(jī)制,例,2,續(xù),而安騰處理機(jī)可以通過編譯優(yōu)化消除條件語句中的分支指令,將該結(jié)構(gòu)轉(zhuǎn)化成順序的推測(cè)執(zhí)行結(jié)構(gòu):,cmpeq,P1,,,P2=0,,,x,;,/,無條件執(zhí)行:將,r4,寄存器的值與,0,比較,若相等則置推斷寄存器,P1,為,1,,,P2,為,0,,否則置推斷寄存器,P1,為,0,,,P2,為,1,(P1)add m=1,,,m /,若,P1,為,1,,則,m+1,送,m(P2)add m=-1,,,m /,若,P2,為,1,,則,m-1,送,m,從判定流程上,似乎上面的三條語句并沒有從邏輯上改變,if-then-else,結(jié)構(gòu)的執(zhí)行過程。但如果我們能夠把這個(gè)例子和安騰體系結(jié)構(gòu)結(jié)合起來,還是可以從這個(gè)簡(jiǎn)單的例子中體會(huì)到安騰處理機(jī)的設(shè)計(jì)思想。,10.4,指令級(jí)并行機(jī)制,4,、安騰處理機(jī)設(shè)計(jì)思想,首先,安騰指令系統(tǒng)中的每條指令都能夠支持推斷執(zhí)行,所以第二條指令和第三條指令中的條件判斷并不需要使用專門的判斷指令。雖然后面兩條指令是條件執(zhí)行

    展開閱讀全文
    溫馨提示:
    1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
    2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
    3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
    4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
    5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
    6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
    7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

    相關(guān)資源

    更多
    正為您匹配相似的精品文檔
    關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

    copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

    備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


    本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!

    欧美久久久一区二区三区,国产精品亚洲一区二区无码,亚洲国产精品综合久久20声音,亚洲国产精品无码久久久蜜芽
    <span id="plx27"><var id="plx27"></var></span>
    <dfn id="plx27"><var id="plx27"></var></dfn>
  • <span id="plx27"><code id="plx27"><input id="plx27"></input></code></span>
    <menu id="plx27"></menu><menuitem id="plx27"><thead id="plx27"><input id="plx27"></input></thead></menuitem>
  • <label id="plx27"><code id="plx27"></code></label>
    <label id="plx27"><button id="plx27"></button></label>