Ada iter
parameter dalam gensim
implementasi Word2Vec
class gensim.models.word2vec.Word2Vec (kalimat = Tidak ada, ukuran = 100, alpha = 0,025, window = 5, min_count = 5, max_vocab_size = Tidak ada, sampel = 0, seed = 1, pekerja = 1, min_alpha = 0,0001, sg = 1, hs = 1, negatif = 0, cbow_mean = 0, hashfxn =, iter = 1 , null_word = 0, trim_rule = Tidak ada, sort_vocab = 1)
yang menentukan jumlah zaman, yaitu:
iter = jumlah iterasi (zaman) di atas corpus.
Apakah ada yang tahu apakah itu membantu dalam meningkatkan model di atas corpus?
Apakah ada alasan mengapa iter
defaultnya adalah 1? Apakah tidak ada banyak efek dalam meningkatkan no. zaman?
Apakah ada evaluasi ilmiah / empiris tentang bagaimana mengatur no. zaman?
Tidak seperti tugas klasifikasi / regresi, metode pencarian kisi tidak akan benar-benar berfungsi karena vektor dihasilkan dengan cara yang tidak diawasi dan fungsi objektifnya hanya dengan softmax hierarkis atau pengambilan sampel negatif.
Apakah ada mekanisme penghentian dini untuk mengurangi no. zaman sekali vektor menyatu? Dan bisakah softmax hierarkis atau objektif pengambilan sampel negatif bertemu?