दिलचस्प पोस्ट
पिक्सेसो लाइब्रेरी के साथ ListView का उपयोग करना चेतावनी: session_start () विफल: ऐसा कोई फ़ाइल या निर्देशिका नहीं है पहलुओं के लिए अलग-अलग लाइनें कैसे जोड़ें यह नया asp.NET सुरक्षा भेद्यता कितनी गंभीर है और मैं इसे कैसे हल कर सकता हूँ? परिसंपत्ति पाइपलाइन में रूट सहायक ज्वैक @ ओवरराइड एनोटेशन पर क्यों असफल है रिक्त सूची के अंत में कैसे जोड़ना है? डेटाबेस, तालिका और स्तंभ नामकरण सम्मेलनों? SQL Server 2008 रिक्त स्ट्रिंग बनाम स्पेस एंड्रॉइड स्टूडियो में मैं एक पुस्तकालय परियोजना कैसे जोड़ूं? मैं सभी वर्गों को पैकेज में कैसे गणना कर सकता हूं और उन्हें सूची में जोड़ सकता हूं? एंड्रॉइड पर मैं मीडियास्टोर को कैसे रिफ्रेश कर सकता हूं? क्या Xcode को स्थापित किए बिना OSX में जीसीसी स्थापित करने का कोई तरीका है? प्योर में एक फ़ाइल के साथ परिक्रमा के दौरान या फिर पर्ल में क्या अंतर है? XMLHttpRequest https: // www लोड नहीं कर सकता। .com /

कैसे एक गर्म सांकेतिक शब्दों में बदलना संस्करण की लंबाई विशेषताएं?

संस्करण की लंबाई की विशेषताओं की सूची को देखते हुए:

features = [ ['f1', 'f2', 'f3'], ['f2', 'f4', 'f5', 'f6'], ['f1', 'f2'] ] 

जहां प्रत्येक नमूने में कई प्रकार की विशेषताएं हैं और फीचर dtype str और पहले से ही एक गर्म है

स्केलैन के फीचर चयन उपयोगिताओं का उपयोग करने के लिए, मुझे features को 2 डी-सरणी में कनवर्ट करना होगा जो ऐसा दिखता है:

  f1 f2 f3 f4 f5 f6 s1 1 1 1 0 0 0 s2 0 1 0 1 1 1 s3 1 1 0 0 0 0 

मैं स्केलेर्न या एमएमपी के माध्यम से इसे कैसे हासिल कर सकता हूं?

Solutions Collecting From Web of "कैसे एक गर्म सांकेतिक शब्दों में बदलना संस्करण की लंबाई विशेषताएं?"

आप साइकोकिट में मल्टीलेबलबिनारिजर का उपयोग कर सकते हैं जो विशेष रूप से ऐसा करने के लिए किया जाता है।

आपके उदाहरण के लिए कोड:

 features = [ ['f1', 'f2', 'f3'], ['f2', 'f4', 'f5', 'f6'], ['f1', 'f2'] ] from sklearn.preprocessing import MultiLabelBinarizer mlb = MultiLabelBinarizer() new_features = mlb.fit_transform(features) 

आउटपुट:

 array([[1, 1, 1, 0, 0, 0], [0, 1, 0, 1, 1, 1], [1, 1, 0, 0, 0, 0]]) 

यह एक अन्य पाइपलाइन में भी इस्तेमाल किया जा सकता है, साथ ही अन्य फीचर्स_सच्ची उपयोगिताओं।

यहां NumPy विधियों और पेंडस डेटाफ्रेम के रूप में आउटपुट के साथ एक दृष्टिकोण है –

 import numpy as np import pandas as pd lens = list(map(len, features)) N = len(lens) unq, col = np.unique(np.concatenate(features),return_inverse=1) row = np.repeat(np.arange(N), lens) out = np.zeros((N,len(unq)),dtype=int) out[row,col] = 1 indx = ['s'+str(i+1) for i in range(N)] df_out = pd.DataFrame(out, columns=unq, index=indx) 

नमूना इनपुट, आउटपुट –

 In [80]: features Out[80]: [['f1', 'f2', 'f3'], ['f2', 'f4', 'f5', 'f6'], ['f1', 'f2']] In [81]: df_out Out[81]: f1 f2 f3 f4 f5 f6 s1 1 1 1 0 0 0 s2 0 1 0 1 1 1 s3 1 1 0 0 0 0