在 Python 中重組陣列
Muhammad Waiz Khan
2023年1月30日
2021年2月28日
在本教程中,我們將探討在 Python 中對陣列進行重組的各種方法。陣列的重組意味著重新排列陣列中元素的位置。陣列重組的應用之一是在模型訓練中,我們需要對資料集進行重組以提高模型的訓練質量。它也可以用於統計學的許多應用中。
在 Python 中使用 random.shuffle()
方法對陣列進行重組
random.shuffle()
方法接收一個序列作為輸入並對其進行重組。這裡需要注意的是,random.shuffle()
方法並不返回一個新的序列作為輸出,而是對原始序列進行重組。因此,有效的輸入序列只能是可變的資料型別,如陣列或列表等。
random.shuffle()
方法只對一維序列有效。下面的示例程式碼演示瞭如何在 Python 中使用 random.shuffle()
來重組一個陣列。
import random
import numpy as np
mylist = ["apple", "banana", "cherry"]
x = np.array((2,3,21,312,31,31,3123,131))
print(x)
print(mylist)
random.shuffle(mylist)
random.shuffle(x)
print(x)
print(mylist)
輸出:
[ 2 3 21 312 31 31 3123 131]
['apple', 'banana', 'cherry']
[3123 21 312 3 2 131 31 31]
['banana', 'apple', 'cherry']
在 Python 中使用 sklearn
模組的 shuffle()
方法對一個陣列進行重組
sklearn.utils.shuffle(array, random_state, n_samples)
方法將具有相同第一維度的可索引序列如陣列、列表或資料框等作為輸入,並返回作為輸入提供的重組序列的副本。
sklearn.utils.shuffle()
並不改變原始輸入,而是返回輸入的重組副本。輸入可以是單個或多個序列。random_state
引數用於控制數字的隨機生成。如果它被設定為某個整數,則該方法每次都會返回相同的重組序列。n_samples
代表樣本數,它的預設值等於輸入預設值的第一維,不應大於輸入陣列的長度。
註釋
如果輸入是 2D,
sklearn.utils.shuffle()
方法將只對行進行重組。下面的示例程式碼演示瞭如何在 Python 中使用 sklearn.utils.shuffle()
方法來獲取一個重組後的陣列。
from sklearn.utils import shuffle
import numpy as np
x= np.array([[1, 2, 3], [ 6, 7, 8], [9, 10, 12]])
y = ['one', 'two', 'three']
z = [4, 5, 6]
print(x)
print(y)
print(z)
x,y,z = shuffle(x, y, z, random_state=0)
print(x)
print(y)
print(z)
輸出:
[[ 1 2 3]
[ 6 7 8]
[ 9 10 12]]
['one', 'two', 'three']
[4, 5, 6]
[[ 9 10 12]
[ 6 7 8]
[ 1 2 3]]
['three', 'two', 'one']
[6, 5, 4]