Menu
[--mobilemenu--]
บราวเซอร์ของท่านไม่สนับสนุนหรือปิดการใช้งาน javascript ซึ่งจะไม่สามารถใช้งานไซต์บางส่วนเช่นการเข้าลิ้งค์ หรือโพสข้อความได้ตามปกติ, กรุณาเปิดการใช้งาน javascript เพื่อที่จะใช้งานเว็บ gconhubม หากมีปัญหาในการใช้งาน หรือต้องการสอบถามเพิ่มเติม กรุณาติดต่อ [email protected] หรือ [email protected]
ดูทรง Console gen หน้า คิดว่าจะยังเป็น x64 ต่อไปหรือจะเป็น ARM

Reply
Vote
# Thu 3 Dec 2020 : 10:18AM

Sukoy
member

Since 24/6/2005
(15466 post)
วิศวกร Amazon Web Service เอา Windows ARM64 ไปรันเป็น VM บน macOS ใน M1 โดยใช้ QEMU (opensource virtualizer)

Geekbench 5 (Windows AArch64) Single-Core: 1,288 Multi-Core: 5,449 น่าจะเร็วกว่า Desktop ส่วนใหญ่ที่เราใช้ๆ กัน และเร็วกว่า Surface Pro X2 ที่ใช้ SoC Microsoft SQ2 จาก Qualcomm ที่ทำคะแนนได้ ราวๆ 800 / 3,000

ถ้ารัน bootcamp แบบ native คะแนนน่าจะใกล้ๆ native บน macOS (ราวๆ 1,700 / 7,500) แต่ตอนนี้ยังทำไม่ได้

ปีหน้า ตอน Apple ออก CPU Desktop ผมเดาว่าคงได้เห็น x86 emuation ที่เร็วกว่า native 555
[Edited 1 times Sukoy - Last Edit 2020-12-03 10:29:11]
View all 10 comments >
Thu 3 Dec 2020 : 9:43PM

suede
member

Since 23/4/2006
(21917 post)
ปัจจัยอะไรที่ทำให้มันแรงกว่า intel ขนาดนั้น

Fri 4 Dec 2020 : 9:19AM

Sukoy
member

Since 24/6/2005
(15466 post)
หลักๆ ก็คงเรื่อง efficiency

Intel x86 เริ่มต้นมาจาก desktop cpuใช้กับเครื่องเสียบปลั๊ก พัฒนาความแรงเรื่อยๆ หลักๆ ก็จากการลดขนาด process ซึ่งทำให้เพิ่ม transister ได้ แต่สิ่งจำกัดความแรงคือ การกินไฟ (ความร้อน) ยิ่งถ้า laptop cpu การกินไฟยิ่งเป็นข้อจำกัดความแรง

ส่วน ARM มันออกแบบมาเพื่อมือถือรันด้วยแบ็ต performance per watt สูงกว่า x86 5-10 เท่าตั้งแต่ยุคแรกๆ แต่สมัยแรกๆ performance มันก็ได้ระดับมือถือ เพราะ TDP SoC พวกนี้ก็ไม่เกิน 5W ตามการใช้งาน

การออกแบบระบบ Thernal ในชิพ 5W กะพวก >35W ก็ต่างกันมาก 5W ไม่ต้องการความมารถในการถ่ายเทความร้อนจากซิลิกอนออกมาข้างนอกในระดับที่ชิพร้อนๆ ต้องทำได้

เวลาผ่านไปไอ้ 5W (mobile phone SoC) ของ ARM กะ 35W (laptop CPU) ของ x86 มันชักจะใกล้ๆ กันเพราะ ฝั่ง x86 ถูกจำกัดด้วยความร้อนมากกว่าฝั่ง ARM โดยเฉพาะ single-core performance จะเป็นว่า 10 ปีหลัง x86 พัฒนาช้ามากๆ ในขณะที่ ARM ยังเป็นไปตาม Moore's Law

Apple เล็งเห็นจุดนี้ ก็จัดการทำ SoC ระดับ Laptop โดยเบ่ง TDP ของ SoC มาเป็นแถวๆ 10-15W มันก็แซง x86 35W ไปได้ไกลแล้ว

นอกจากเรื่องความแรง การเปลี่ยนมาใช้ ARM Apple ยังกำไรมากขึ้นเพราะ SoC ที่ทำเองถูกกว่าซื้อสำเร็จรูปจาก Intel เยอะมาก Apple's M1ต้นทุนเฉลี่ยน่าจะ $40 to $50 เท่านั้น

ถ้า Apple เบ่ง TDP ขึ้นไปอีกเป็นพวก 35W-50W (เบ่งโดยเพิ่ม core และ clock และอัพ GPU) ไปสู่ระดับ Desktop SoC (ถือเป็นตัวแรกๆ จากฝั่ง ARM) มันก็น่าจะแรงขึ้นไปอีก อาจจะไม่ linear แบบแรงขึ้น 3-4 เท่าจาก M1 แต่คงได้ 2X-3X ตรง mulicore performance ได้โดยไม่ยาก ส่วน single core ขอแค่ราวๆ 1.5x จาก M1 ซึ่งแค่นี้ก็ทิ้ง x86 หลายช่วงตัวล่ะ

อีกข้อที่วิศวกรคอมพิวเตอร์บอกว่าช่วยเรื่อง performance อย่างหนักคือ unified memory

Apple SoC ทั้ง CPU, GPU, NPU เล่นกะ memory ได้โดยตรงทุกส่วน ไม่ต้องทำ memcopy operation เยอะมากแบบฝั่ง PC ที่ GPU ทำงานเหมือนเป็นอีกส่วนที่แยกออกมาจากระบบหลัก เป็นคอขวดขนาดหนัก ที่กินทั้ง memory bandwidth และเสียพลัง cpu

ป.ล. Unified memory มันไม่เหมือนแค่การกัน RAM มาให้ GPU onboard ในสมัยนึงที่ PC เคยทำ อันนั้นเรียก shared memory ซึ่งมันยิ่งกากกว่าแบบ GPU มี mem เร็วๆ ขอตัวเอง อันนั้นทำเพื่อประหยัดตังค์ ในการทำงานมันต้องทำ memcopy ระหว่า CPU/GPU memory อยู่ดี
[Edited 6 times Sukoy - Last Edit 2020-12-04 09:42:44]

Fri 4 Dec 2020 : 9:52AM

Burm
member

Since 15/3/2006
(17202 post)
ขยายเรื่อง shared กับ unified memory ให้

shared memory แบบพวก gpu on board มันคือการ "กัน" แรมส่วนนึงไปให้ gpu ใช้ โดยที่ gpu จะไม่มี แรมของตัวเอง
แต่มันเป็นการ "กัน" ไปใช้ นั่นหมายความว่า gpu จะเข้าถึง ram เฉพาะส่วนที่แบ่งมาให้ แต่ไม่สามารถอ่านข้อมูลจากแรมของ CPU ได้
ทำให้เวลาจะเอาข้อมูลอะไรที่ CPU ประมวลผล เช่นอ่าน texture ก็ต้อง copy จากแรม CPU ไปหา แรม GPU
ที่บอกว่าช้ากว่า ram บนการ์ดจอแยก เพราะ แรมบนการ์ดจอแยกมันเร็วกว่า แรมที่ cpu แบ่งมาให้เยอะ

แต่ unfied memory มันคือการที่ cpu กับ gpu มองแรมเป็นก้อนเดียวกันหมด ต่างคนต่างอ่านของกันและกันได้
มันเลยลดขั้นตอนการ copy memory ลงไปทำให้เร็วขึ้นมาก

แต่จริงๆ ถ้าผมจำไม่ผิด console ทำแบบนี้มาตั้งแต่สมัย xbox 360 แล้วนะ
แต่ของ pc นี่เพิ่งมีของ amd ที่ทำระบบพิเศษให้อ้างอิงแรม cpu ได้โดยตรง


นอกจากเรื่องสถาปตยกรรมความร้อนแล้ว เหมือนการออกแบบ cpu ยุคใหม่ๆ จะเน้นการใส่หน่วยช่วยประมวลผลลงไปด้วย
ทั้งการเข้ารหัส ถอดรหัส video (macbook pro ผมเล่น video 4kHDR ไม่ได้ แต่มือถือเล่นได้ลื่นๆ) หรือหน่วยประมวลผล AI
คือลำพัง single core มันก็แรงกว่า แล้วยังมีพวกนี้มาช่วยอีก
[Edited 1 times Burm - Last Edit 2020-12-04 09:54:19]

Fri 4 Dec 2020 : 10:43AM

Sukoy
member

Since 24/6/2005
(15466 post)
iMac ผมก็เล่น youtube 8K60Hz ไม่รอด เดี๋ยวรอดู M1

Fri 4 Dec 2020 : 1:43PM

HellIsMyHome
member

Since 30/5/2010
(2682 post)
Single core ของ x86 ปัจจุบันของทั้ง amd,intel นี่มันถูกออกแบบมาเพื่อใช้งานพร้อม logic thread (ht, smt) ทั้งนั้นเลยนะครับ ซึ่งถ้าจะเอาแฟร์ๆ single core benchmark ต้องมีการ take advantage ตรงนี้ด้วย
จากที่ผมเห็นผลเทสมาแว้บๆคือถ้า take advantage ตรงนี้ x86 ก็ดูยังชนะอยู่ (แต่คงต้องรอผลเทสมากกว่านี้เพื่อความน่าเชื่อถือมากขึ้น)
ยังไม่นับ dedicated hw ทั้งหลายที่พวก soc ชอบยัดมา offload งานจากตัวคอร์หลัก cpu จริงๆอีก ต่างกันกับ x86 ที่ไม่เป็น soc แล้วเวลาใช้งาน cpu นี่ก็คือ general purpose แท้ทรู
ถ้ามอง complete package ก็ถือว่า M1 ทำมาดี (แนวทาง mobile น่ะแหละ) แต่ถ้าจะเทียบเป็นส่วนๆ dev คงต้องไป take advantage แต่ละแพลตฟอร์มแล้วลองเทียบกันเองแล้วแหละ อันไหนดีกว่าเลวกว่า

Fri 4 Dec 2020 : 2:10PM

Sukoy
member

Since 24/6/2005
(15466 post)
HellIsMyHome wrote:
Single core ของ x86 ปัจจุบันของทั้ง amd,intel นี่มันถูกออกแบบมาเพื่อใช้งานพร้อม logic thread (ht, smt) ทั้งนั้นเลยนะครับ ซึ่งถ้าจะเอาแฟร์ๆ single core benchmark ต้องมีการ take advantage ตรงนี้ด้วย
จากที่ผมเห็นผลเทสมาแว้บๆคือถ้า take advantage ตรงนี้ x86 ก็ดูยังชนะอยู่ (แต่คงต้องรอผลเทสมากกว่านี้เพื่อความน่าเชื่อถือมากขึ้น)
ยังไม่นับ dedicated hw ทั้งหลายที่พวก soc ชอบยัดมา offload งานจากตัวคอร์หลัก cpu จริงๆอีก ต่างกันกับ x86 ที่ไม่เป็น soc แล้วเวลาใช้งาน cpu นี่ก็คือ general purpose แท้ทรู
ถ้ามอง complete package ก็ถือว่า M1 ทำมาดี (แนวทาง mobile น่ะแหละ) แต่ถ้าจะเทียบเป็นส่วนๆ dev คงต้องไป take advantage แต่ละแพลตฟอร์มแล้วลองเทียบกันเองแล้วแหละ อันไหนดีกว่าเลวกว่า


ผมไม่ค่อยเข้าใจเรื่อง logic thread ที่คุณว่านะ หมายถึง x86 มัน optimize มาสำหรับ MT ที่มี brance เยอะๆ มั่วๆ เดาไม่ค่อยถูกเหรอครับ workload ประเภทไหน ที่เข้าข่ายนี้มั่ง compiling อะไรแบบนั้นหรือครับ? เท่าที่ดู M1ก็เร็วดีนะ และพวก content creation ที่มีโหลด UI กะ I/O เยอะๆ นี่ยิ่งลื่นหนัก

Fri 4 Dec 2020 : 8:57PM

HellIsMyHome
member

Since 30/5/2010
(2682 post)
มันคือหลักการ ht/smt แหละครับ 1core/2thread, 4c/8t, 6c/12t ไอ้พวก thread พวกนี้มันไม่ใช่ 1core มี hw thread แยกออกมาสองอัน performance มันเลยไม่ได้ ×2
แต่ด้วยความที่ x86 pipeline มันยาว ถ้าหยิบงานนึงมาทำแล้วรอจนกว่างานนั้นจะจบ จนออกจาก pipeline มันเปลือง มัน utilise hw ได้ไม่ 100%
ก็เลยในเมื่องานแรกมันวิ่งไปจนอยู่ลึกๆใน pipeline แล้วต้นๆ pipeline มันว่างอยู่ นอนกลับสบายเลย ก็เลยหยิบงานใหม่มาทำด้วยเลย ดีกว่าให้นอนรอเฉยๆ
ซึ่งจากผลเทสที่ผมเห็นแว้บๆมา(ซึ่งย้ำอีกว่ารอดูให้เยอะกว่านี้ก่อน ความน่าเชื่อถือน่าจะเยอะขึ้น) bechmark มันไม่ได้ take advantage ตรงนี้ พูดในแง่ที่ว่าถ้าเราจะเทียบพลัง hw กับแบบ 1:1 นะครับ cpu core ก็เจอกับ cpu core ไม่ต้องมี dedicate hw มาเกี่ยวข้อง
อย่างที่บอกว่าถ้ามอง complete package แล้ว M1 มันก็ถือว่าทำได้ดี(สมมุติว่ามี dedicate hw ช่วยเยอะจริงๆ) เพราะพวก dedicate hw ที่ยัดมาใน soc เนี่ย ถ้าสมมุติมันถูก take advantage ตรงนี้แล้วออกมาได้ดีกว่าหรือเทียบเท่า x86, ทาง dev จะมีเหตุผลอะไรถึงจะไม่ใช้มัน, แต่ทั้งนี้ทั้งนั้นพอพูดถึง context ด้าน game แล้วเนี่ย dedicate hw ทั้งหลาย ไม่รู้จะถูกใช้ประโยชน์ได้แค่ไหน ถ้าหากสมมุติมันใช้ได้น้อยนิดสู้ x86 ไม่ได้ จะมีเหตุผลอะไรที่จะต้องย้ายไป arm เหมือนกัน

เพิ่มเติม
Workload แบบไหน เอาตามกระทู้ก็เกมก็ได้ครับ ที่มันไม่ได้มีแค่ระบบเดียวเดี่ยวๆทำงาน ถ้าจำไม่ผิดพวกเกมที่ multithreaded โหดๆ นี่ก็ได้ performance มาพอสมควร
[Edited 1 times HellIsMyHome - Last Edit 2020-12-04 21:02:36]

Fri 4 Dec 2020 : 10:32PM

suede
member

Since 23/4/2006
(21917 post)
Sukoy wrote:
หลักๆ ก็คงเรื่อง efficiency

Intel x86 เริ่มต้นมาจาก desktop cpuใช้กับเครื่องเสียบปลั๊ก พัฒนาความแรงเรื่อยๆ หลักๆ ก็จากการลดขนาด process ซึ่งทำให้เพิ่ม transister ได้ แต่สิ่งจำกัดความแรงคือ การกินไฟ (ความร้อน) ยิ่งถ้า laptop cpu การกินไฟยิ่งเป็นข้อจำกัดความแรง

ส่วน ARM มันออกแบบมาเพื่อมือถือรันด้วยแบ็ต performance per watt สูงกว่า x86 5-10 เท่าตั้งแต่ยุคแรกๆ แต่สมัยแรกๆ performance มันก็ได้ระดับมือถือ เพราะ TDP SoC พวกนี้ก็ไม่เกิน 5W ตามการใช้งาน

การออกแบบระบบ Thernal ในชิพ 5W กะพวก >35W ก็ต่างกันมาก 5W ไม่ต้องการความมารถในการถ่ายเทความร้อนจากซิลิกอนออกมาข้างนอกในระดับที่ชิพร้อนๆ ต้องทำได้

เวลาผ่านไปไอ้ 5W (mobile phone SoC) ของ ARM กะ 35W (laptop CPU) ของ x86 มันชักจะใกล้ๆ กันเพราะ ฝั่ง x86 ถูกจำกัดด้วยความร้อนมากกว่าฝั่ง ARM โดยเฉพาะ single-core performance จะเป็นว่า 10 ปีหลัง x86 พัฒนาช้ามากๆ ในขณะที่ ARM ยังเป็นไปตาม Moore's Law

Apple เล็งเห็นจุดนี้ ก็จัดการทำ SoC ระดับ Laptop โดยเบ่ง TDP ของ SoC มาเป็นแถวๆ 10-15W มันก็แซง x86 35W ไปได้ไกลแล้ว

นอกจากเรื่องความแรง การเปลี่ยนมาใช้ ARM Apple ยังกำไรมากขึ้นเพราะ SoC ที่ทำเองถูกกว่าซื้อสำเร็จรูปจาก Intel เยอะมาก Apple's M1ต้นทุนเฉลี่ยน่าจะ $40 to $50 เท่านั้น

ถ้า Apple เบ่ง TDP ขึ้นไปอีกเป็นพวก 35W-50W (เบ่งโดยเพิ่ม core และ clock และอัพ GPU) ไปสู่ระดับ Desktop SoC (ถือเป็นตัวแรกๆ จากฝั่ง ARM) มันก็น่าจะแรงขึ้นไปอีก อาจจะไม่ linear แบบแรงขึ้น 3-4 เท่าจาก M1 แต่คงได้ 2X-3X ตรง mulicore performance ได้โดยไม่ยาก ส่วน single core ขอแค่ราวๆ 1.5x จาก M1 ซึ่งแค่นี้ก็ทิ้ง x86 หลายช่วงตัวล่ะ

อีกข้อที่วิศวกรคอมพิวเตอร์บอกว่าช่วยเรื่อง performance อย่างหนักคือ unified memory

Apple SoC ทั้ง CPU, GPU, NPU เล่นกะ memory ได้โดยตรงทุกส่วน ไม่ต้องทำ memcopy operation เยอะมากแบบฝั่ง PC ที่ GPU ทำงานเหมือนเป็นอีกส่วนที่แยกออกมาจากระบบหลัก เป็นคอขวดขนาดหนัก ที่กินทั้ง memory bandwidth และเสียพลัง cpu

ป.ล. Unified memory มันไม่เหมือนแค่การกัน RAM มาให้ GPU onboard ในสมัยนึงที่ PC เคยทำ อันนั้นเรียก shared memory ซึ่งมันยิ่งกากกว่าแบบ GPU มี mem เร็วๆ ขอตัวเอง อันนั้นทำเพื่อประหยัดตังค์ ในการทำงานมันต้องทำ memcopy ระหว่า CPU/GPU memory อยู่ดี


จากที่อ่าน แล้ว Entry barriers มันหนาขนาดไหน ไม่ใช่ว่า intel เดินตามโยนเงิน เลิกนอนหลับแป๊บเดียวตีกลับ​บมาได้เหรอครับ

เพราะดูหลักการไม่ใช่อะไรที่ยากเกินจะเลียนแบบไม่ทัน

Sat 5 Dec 2020 : 11:55AM

Burm
member

Since 15/3/2006
(17202 post)
มันไม่ใแค่เอาเงินยัดแล้วจบนี่ครับ
ที่แน่ๆ intel พยายามจะใช้การผลิตแบบ 10nm มาหลายปีแล้ว แต่ทำไม่ได้ เนื่องจาก yield ต่ำมาก (ปกติการผลิต cpu ผลิต 100 ชิ้นไม่ใช่ว่าใช้ได้เต็มที่ทั้ง 100 มันจะมีบางชิ้นที่ทำงานไม่ได้ตลม spec หรือเสียไปเลย อัตราส่วนเหล่านี้คือ “yield rate” ซึ่งบางทีพวกตก spec เขาก็เอาไปลด clock หรือปิด core แล้วเอาไปขายเป็นรุ่นต่ำกว่าแทน)
มันคงมีปัญหาอะไรสักอย่างแหละ
[Edited 1 times Burm - Last Edit 2020-12-05 11:57:02]

Sat 5 Dec 2020 : 12:31PM

Sukoy
member

Since 24/6/2005
(15466 post)
ถ้าแก้ด้วยเงินได้ x86 คงไม่โดน AMD แซง

ส่วนแก้ x86 ให้ไปสู้กะ ARM อันนี้เงินคงช่วยยาก

ง่ายกว่าคือไป license ARM มาแล้วออกแบบให้มันดีๆ


Reply
Vote




1 online users
Logged In :