數(shù)據(jù)挖掘技術(shù)就是利用機(jī)器學(xué)習(xí)統(tǒng)計數(shù)學(xué)和可視化技術(shù),從大量的數(shù)據(jù)庫中確認(rèn)出有效的、新穎的、潛在的、有用的以及最終挖掘出可理解模式的高級處理過程,數(shù)據(jù)挖掘?qū)嶋H上是數(shù)據(jù)庫中的知識發(fā)現(xiàn)過程。
1、數(shù)據(jù)挖掘:過程與方法 數(shù)據(jù)挖掘是將人工智能技術(shù)(神經(jīng)網(wǎng)絡(luò),模糊邏輯,遺傳算法等)應(yīng)用到大規(guī)模數(shù)據(jù)中,從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
數(shù)據(jù)挖掘作為知識發(fā)現(xiàn)的一個特定步驟,是知識發(fā)現(xiàn)的核心。它的目標(biāo)是利用算法,從數(shù)據(jù)中抽取模式,將大容量數(shù)據(jù)轉(zhuǎn)換為有用的知識和信息。
這里所提的模式包括模型或結(jié)構(gòu)。數(shù)據(jù)挖掘的過程一般由三個主要的階段組成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)采集、結(jié)果表達(dá)和解釋。數(shù)據(jù)挖掘方法有很多種,其中比較典型的有關(guān)聯(lián)分析、序列模式分析、分類分析、聚類分析等。
關(guān)聯(lián)分析是利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,目的是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系,關(guān)聯(lián)規(guī)則是描述事物之間同時出現(xiàn)的規(guī)律的知識模式。序列模式分析和關(guān)聯(lián)分析相似,是把數(shù)據(jù)之間的關(guān)聯(lián)性與時間性聯(lián)系起來,側(cè)重點在于分析數(shù)據(jù)間的前后或因果關(guān)系,為了發(fā)現(xiàn)序列模式,不僅需要知道事件是否發(fā)生,而且需要確定事件發(fā)生的時間。分類分析就是分析示例數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準(zhǔn)確的描述、建立分析模型或挖掘出分類規(guī)則,把集中的數(shù)據(jù)映射到某個給定的類上,其輸入集是一組記錄集合和幾種標(biāo)記。與分類分析不同,聚類分析法的輸入集是一組未標(biāo)定的記錄,也就是說此時輸入的記錄還沒有進(jìn)行任何分類,其目的是根據(jù)一定的規(guī)則,合理地劃分記錄集合,使組之間的差別盡可能大、組內(nèi)的差別盡可能小。
現(xiàn)代物流的新理念包括反應(yīng)快速化、服務(wù)系列化、作業(yè)規(guī)范化、目標(biāo)系統(tǒng)化、手段現(xiàn)代化、組織網(wǎng)絡(luò)化、經(jīng)營市場化,這些都離不開完善的信息系統(tǒng)的支撐。隨著數(shù)據(jù)量的劇增,數(shù)據(jù)挖掘技術(shù)將成為深化物流信息管理的最有效方法,在解決選址、倉儲和配送等基礎(chǔ)物流問題方面可以發(fā)揮出很大的作用。 2、選址問題 物流中心的選址屬于最小成本問題,即求解為運(yùn)輸成本、變動處理成本和固定成本等之和的最小化問題。選址需要考慮到中心點數(shù)量和中心點如何分布等情況,尤其是多中心選址的問題。多中心選址是指在一些已知的備選地點中選出一定數(shù)目的地點來設(shè)置物流中心,使形成的物流網(wǎng)絡(luò)的總費(fèi)用最小。在實際操作中,當(dāng)問題規(guī)模變得很大,或者要考慮一些市場因素(比如顧客需求量)時,數(shù)學(xué)規(guī)劃就存在一些困難。針對這一問題,可以用數(shù)據(jù)挖掘中的分類樹方法來加以解決。
分類樹的目標(biāo)是連續(xù)的劃分?jǐn)?shù)據(jù),使依賴變量的差別最大。分類樹的真正的目的是將數(shù)據(jù)分類到不同組或分支中,在依賴變量的值上建立最強(qiáng)劃分。用分類樹的方法解決這個問題時,通常需要以下四個方面的數(shù)據(jù):中心點的位置、每個中心點的業(yè)務(wù)需求量、備選點的位置、在中心點和備選點之間的距離。
通過分類樹的方法,不僅確定了中心點的位置,同時也確定每年各個地址間物品的運(yùn)輸量,使整個企業(yè)必要的銷售量得到保證,企業(yè)長期折現(xiàn)的總成本也會達(dá)到最小值。 3、配送問題 配送問題,包括配送計劃的編制、配送路線的設(shè)計優(yōu)化以及配送過程中的配載(混載)問題。在許多配送體系中,管理人員需要采取有效的配送策略以提高服務(wù)水平、降低貨運(yùn)費(fèi)用。其中首要的難題,就是車輛的路徑問題。車輛路徑問題是為一些車輛確定一些客戶的路徑,每一客戶只能被訪問一次,且每條路徑上的客戶需求量之和不能超過車輛的承載能力。
要合理解決這個問題,需要物流設(shè)計人員考慮到車輛的利用能力,如果車輛在運(yùn)輸過程中的空載率過高或整車的運(yùn)力不完全利用,這些無疑會增加企業(yè)的運(yùn)輸成本。另外還涉及到車輛的運(yùn)輸能力,這就必須考慮到貨品的規(guī)格大小和利潤價值的大小。
在采取有效的配送策略時這些因素都必須同時考慮,這時如果能夠?qū)︻櫩偷男枨蠛瓦\(yùn)輸路徑綜合起來進(jìn)行分類,對整個配送策略中車輛的合理選擇分派會有較好的作用。 ..
|