AttributeError: объект int не имеет атрибута strip, когда я пытаюсь закодировать список данных

AttributeError: объект int не имеет атрибута strip, когда я пытаюсь закодировать список данных

Я пытаюсь закодировать данные с помощью приведенного ниже кода

И код ниже:

      encoded_data = model.encode(df.Content.tolist())
encoded_data = np.asarray(encoded_data.astype('float32'))
index = faiss.IndexIDMap(faiss.IndexFlatIP(768))
ids = np.array(range(0, len(df)))
ids = np.asarray(ids.astype('int64'))
index.add_with_ids(encoded_data, ids)

Ошибка связана с первой строкой кода encoded_data = model.encode(df.Content.tolist())

Ошибка, которую он возвращает:

      AttributeError                            Traceback (most recent call last)
<timed exec> in <module>

~\t5\lib\site-packages\sentence_transformers\SentenceTransformer.py in encode(self, sentences, batch_size, show_progress_bar, output_value, convert_to_numpy, convert_to_tensor, device, normalize_embeddings)
    188         for start_index in trange(0, len(sentences), batch_size, desc="Batches", disable=not show_progress_bar):
    189             sentences_batch = sentences_sorted[start_index:start_index+batch_size]
--> 190             features = self.tokenize(sentences_batch)
    191             features = batch_to_device(features, device)
    192 

~\t5\lib\site-packages\sentence_transformers\SentenceTransformer.py in tokenize(self, text)
    340         Tokenizes the text
    341         """
--> 342         return self._first_module().tokenize(text)
    343 
    344     def get_sentence_features(self, *features):

~\t5\lib\site-packages\sentence_transformers\models\Transformer.py in tokenize(self, texts)
     78 
     79         #strip
---> 80         to_tokenize = [[s.strip() for s in col] for col in to_tokenize]
     81 
     82         #Lowercase

~\t5\lib\site-packages\sentence_transformers\models\Transformer.py in <listcomp>(.0)
     78 
     79         #strip
---> 80         to_tokenize = [[s.strip() for s in col] for col in to_tokenize]
     81 
     82         #Lowercase

~\t5\lib\site-packages\sentence_transformers\models\Transformer.py in <listcomp>(.0)
     78 
     79         #strip
---> 80         to_tokenize = [[s.strip() for s in col] for col in to_tokenize]
     81 
     82         #Lowercase

AttributeError: 'int' object has no attribute 'strip'

Столбец, который я пытаюсь кодировать, является объектом, и он возвращает объект int, не имеющий полосы атрибутов

0 ответов

Другие вопросы по тегам