AttributeError: объект int не имеет атрибута strip, когда я пытаюсь закодировать список данных
AttributeError: объект int не имеет атрибута strip, когда я пытаюсь закодировать список данных
Я пытаюсь закодировать данные с помощью приведенного ниже кода
И код ниже:
encoded_data = model.encode(df.Content.tolist())
encoded_data = np.asarray(encoded_data.astype('float32'))
index = faiss.IndexIDMap(faiss.IndexFlatIP(768))
ids = np.array(range(0, len(df)))
ids = np.asarray(ids.astype('int64'))
index.add_with_ids(encoded_data, ids)
Ошибка связана с первой строкой кода encoded_data = model.encode(df.Content.tolist())
Ошибка, которую он возвращает:
AttributeError Traceback (most recent call last)
<timed exec> in <module>
~\t5\lib\site-packages\sentence_transformers\SentenceTransformer.py in encode(self, sentences, batch_size, show_progress_bar, output_value, convert_to_numpy, convert_to_tensor, device, normalize_embeddings)
188 for start_index in trange(0, len(sentences), batch_size, desc="Batches", disable=not show_progress_bar):
189 sentences_batch = sentences_sorted[start_index:start_index+batch_size]
--> 190 features = self.tokenize(sentences_batch)
191 features = batch_to_device(features, device)
192
~\t5\lib\site-packages\sentence_transformers\SentenceTransformer.py in tokenize(self, text)
340 Tokenizes the text
341 """
--> 342 return self._first_module().tokenize(text)
343
344 def get_sentence_features(self, *features):
~\t5\lib\site-packages\sentence_transformers\models\Transformer.py in tokenize(self, texts)
78
79 #strip
---> 80 to_tokenize = [[s.strip() for s in col] for col in to_tokenize]
81
82 #Lowercase
~\t5\lib\site-packages\sentence_transformers\models\Transformer.py in <listcomp>(.0)
78
79 #strip
---> 80 to_tokenize = [[s.strip() for s in col] for col in to_tokenize]
81
82 #Lowercase
~\t5\lib\site-packages\sentence_transformers\models\Transformer.py in <listcomp>(.0)
78
79 #strip
---> 80 to_tokenize = [[s.strip() for s in col] for col in to_tokenize]
81
82 #Lowercase
AttributeError: 'int' object has no attribute 'strip'
Столбец, который я пытаюсь кодировать, является объектом, и он возвращает объект int, не имеющий полосы атрибутов