Sulit untuk mengisolasi CPU, saya tahu, tetapi kesalahan yang saya lihat menunjukkan bahwa itulah masalahnya.
Ini jelas bukan masalah perangkat keras yang rusak / rusak . Saya telah menjalankan Windows 10 sepanjang hari selama beberapa hari terakhir dan hal ini cepat sekali! Tidak menabrak Lebih penting lagi, saya menjalankan pemeriksa memori Windows. Ingatan semuanya baik.
spesifikasi mesin
Mesin ini adalah Lenovo Yoga 710 15 "yang baru
x64
Intel i7-6500 CPU @ 2.50 GHz, 2601 Mhz, 2 Cores, 4 Logical Processors
SMBIOS Version 2.8
BIOS Mode UEFI
16.0 GB DDR4 Ram
256 MB SSD
mengisolasi ke kernel linux (?)
Saya telah melihat masalah yang sama pada keduanya
- archlinux-2016.08.01-dual.iso
- ubuntu-gnome-16.04.1-desktop-amd64.iso
Untuk Arch - masalahnya hanya muncul sebentar-sebentar saat boot dari USB stick. Saya berhasil menginstal Arch pada partisi 100GB ext4 pada drive. Instalasi itu memiliki masalah yang sama secara berkala (seperti 90% dari waktu) selama boot. Jika saya melewati boot, maka masalah muncul secara acak setelah beberapa perintah terminal pertama saya jalankan, akhirnya menyebabkan kebuntuan total.
Untuk Ubuntu - stik USB bahkan tidak bisa boot. Saya segera dihentikan oleh kesalahan yang sama ini. Jalan buntu...
Begitu banyak kesalahan ...
Jurnal ini diisi dengan kesalahan terkait memori setiap kali ini terjadi, tetapi kesalahan utama yang saya lihat adalah:
General protection fault 0000[#1] PREEMPT SMP
RIP kmem_cache_alloc
RIP kmem_cache_alloc_trace
Saya telah melihat beberapa jejak tumpukan yang sama beberapa kali untuk kesalahan ini:
rbt_memtype_copy_nth_element
on_each_cpu
flusH_tbl_kernel_range
__purge_umap_area_lazy
um_unmam_aliases
change_page_attr_set_clr
set_memory_ro
frob_text.isra
module_enable_ro
kobject_create
kobject_create_and_add
load_module
__symbol_put
kernel_read
sys_finit_module
entry_SYSCALL_64_fastpath
kmem_cache_alloc_trace
allocate_cgrp_cset_links
...
sys_write
entry_SYSCALL-64_fastpath
Linux juga terus menjanjikan bahwa itu memperbaiki masalah
Memperbaiki kesalahan rekursif tetapi reboot diperlukan!
Saya harap..
ucode intel
Saya juga mencoba menginstal intel-ucode
paket di Arch install saya. Saya melihat dalam dmesg
log bahwa mikrokode diperbarui, tetapi sayangnya itu tidak menyelesaikan masalah saya.
Apa yang bisa menjadi masalah? Bagaimana cara memperbaikinya?
EDIT
Catatan tambahan.
Pesan kesalahan perlindungan umum dan pesan "terkunci terdeteksi" biasanya merujuk pada CPU. Saya telah melihat CPU0
, CPU1
, CPU2
dan CPU3
dalam pesan tersebut. Sepertinya ada sesuatu yang menyebabkan CPU tidak rukun, seperti mereka semua berada di jalan buntu mencoba membersihkan memori cache atau sesuatu.
EDIT2
BIOS disebutkan dalam kesalahan
Saya melihat sedikit informasi ini dalam beberapa kesalahan:
LENOVO 80U01LENOVO YOGA710-1 BIOS OGCN20WW(v1.04) 6/30/2016
Tidak yakin apakah itu membantu pro dalam memahami masalah ...
EDIT3
maxcpus = 1
Saya mencari opsi debug pada dokumentasi kernel params dan menemukanmaxcpus
Jika saya mengatur max cpu ke 1, maka masalahnya hilang. Jadi sepertinya masalahnya adalah beberapa jenis pelanggaran memori cache bersama.
EDIT3
maxcpus = 1 + Gnome = rusak lagi
Meskipun maxcpus=1
sepertinya membuat sistem bekerja hanya dengan 1 CPU, saya menginstal gnome dan kemudian berlarisystemctl enable gdm.service
Sekarang, ketika saya reboot, saya mendapatkan kembali semua kesalahan saya, tapi kali ini semuanya terjadi pada CPU0
Jadi sepertinya ada sesuatu yang masih menyebabkan pelanggaran memori bahkan dengan 1 CPU.
EDIT4
nolapic
Jadi menggunakan nolapic
tampaknya membuat semuanya "berfungsi"
TETAPI dengan menggunakan nolapic
, saya secara efektif menonaktifkan CPU saya yang lain dan semua multithreading dalam 1 CPU yang berfungsi.
Saya mencoba menggunakan ini untuk OpenMP, dan setelah boot dengan nolapic
, OpenMP dan kernel linux hanya dapat menemukan 1 utas, 1 CPU. Itu menyebalkan!
Saya juga mencoba intel_idle.max_cstate=0
dan 1
,, 2
dll. Tapi ini tidak memperbaiki masalah boot.
Apa lagi yang bisa menyebabkan kernel gagal memanfaatkan mesin multi-core saya?
nomodeset
dan nouveau.mode=0
- tidak yakin apakah itu mirip)
maxcpus
- Saya mengaturnya ke 1 dan masalahnya hilang ... Tapi sekarang saya hanya bisa menggunakan satu procesor? :(
nomodeset nouveau.modeset=0
bersama-sama dan jika itu tidak berhasil, cobanomodeset i915.modeset=0 nouveau.modeset=0