دانلود پایان نامه

پارامترهاي تأثيرگذار مي‌باشد. پارامترهاي استفاده شده در اين مدل‌سازي، اطلاعات حاصل از گزارش‌هاي روزانه دکل‌هاي حفاري در ميدان مارون در سال‌هاي 81 تا 85 مي‌باشند. از ميان 1756 مجموعه داده (ورودي و خروجي) بعد از آناليز داده‌ها، 1630 مجموعه داده مربوط به 38 حلقه چاه در مدل‌سازي استفاده شد. بعضي از پارامترهاي موثر به صورت غير مستقيم از پارامترهاي دکل حفاري بدست مي‌آيند. اين پارامترها را مي‌توان از فرمول‌هاي زير محاسبه کرد.
نرخ نفوذ :
(4-4)

طول حفره باز :
(4-5)

فشار گل :
(4-6)

ويسکوزيته پلاستيک و نقطه تسليم :
(4-7)

(4-8)

حجم آنالوس :
(4-9)

در اين فرمول‌ها ROP نرخ نفوذ بر حسب فوت بر ساعت، h متراژ حفاري بر حسب فوت، t زمان بر حسب ساعت، طول حفره باز بر حسب فوت، D عمق حفاري بر حسب فوت، عمق لوله جداري بر حسب فوت، فشار گل بر حسب فوت بر اينچ مربع، MW وزن گل بر حسب پوند بر گالن، نيروي برشي در سرعت 600 دور در ثانيه، نيروي برشي در سرعت 300 دور در ثانيه، قطر مته بر حسب فوت، قطر بيروني لوله حفاري مي‌باشد.
براي در نظر گرفتن نوع سازند و زير بخش‌هاي آن‌ها، به جاي استفاده از نام آن‌ها، از کدهاي عددي استفاده شد تا براي شبکه عصبي قابل فهم شود. آناليز آماري و محدوده پارامترهاي استفاده شده در مدل‌سازي، در جدول 4-3 ليست شده‌اند.
جدول 4-3 آناليز آماري داده هاي استفاده شده در مدل‌سازي هرزروي سيال حفاري
پارامتر
واحد
Min.
Max.
St.Dev
Median
Average
Q (1)
Q (2)
Q (3)
E

1887105
1935965
5/14834
1905439
1909394
1897105
1905439
1920921
N

1005701
1054298
8/13876
1028773
1028816
1015000
1028773
1040088
D
Ft
752
5662
5/796
5/3063
3072
2554
5/3063
5/3619
For.Top
Ft
52/5
1296800
129574
07/10005
80673
3254
07/10005
7/78901
For

09/0
08/48
8/1
31/2
6/2
32/1
3/2
4/3

5
125
5/38
9/15
43
45/15
9/15
70
ROP
Ft/hr
0
4858
1045
2934
2688
2312
2934
3345

GPM
80
1000
4/234
510
13/525
3
510
650

Psi
100
2950
895
2310
7/1959
1150
2310
2800

Psi
6/431
22859
6/7221
8/12084
11399
6/3993
8/12084
18782
MFVis
Cp
0
100
9/10
47
76/48
40
47
56
S
%
0
61
32/16
23
95/25
12
23
43
PV
Cp
0
130
7/27
25
9/36
14
25
57
YP

0
105
9/6
14
5/14
10
14
19
INTGL

0
30
63/2
3
85/3
2
3
5
Min10GL

0
35
95/2
5
3/5
3
5
7
Loss
Bbl
0
1875
6/160
64
2/111
20
64
140

4-3-1-4- گير لوله حفاري
براي داشتن مدلي جامع و فراگير در پيش‌بيني و تعيين نوع گير رشته حفاري، نياز به در نظر گرفتن کليه پارامترهاي تأثيرگذار مي‌باشد. از ميان 950 مجموعه داده (ورودي و خروجي) بعد از آناليز داده‌ها، 874 مجموعه داده مربوط به 33 حلقه چاه در مدل‌سازي استفاده شد. از اين تعداد 86 مورد نشان دهنده گير لوله بوده‌اند.
براي اين بخش نرخ نفوذ، طول حفره باز، فشار گل، ويسکوزيته پلاستيک و نقطه تسليم از فرمول‌هاي قبلي محاسبه مي‌شوند. قطر آنالوس با فرمول زير محاسبه مي‌شود :
(4-10)

در اين بخش نيز نام سازند را با کدهاي عددي نشان داده‌ايم و همچنين گير لوله حفاري را با عدد صفر براي داده‌هاي غير گير، عدد 5/0 براي داده‌هاي گير مکانيکي و عدد 1 را براي داده‌هاي گير اختلاف فشاري نشان داده‌ايم. محدوده پارامترهاي به کار برده شده در جدول 4-4 ليست شده‌اند.

4-3-2- پيش‌پردازش داده‌ها
در اين مرحله، داده‌هاي جمع آوري شده از ميدان، مورد بررسي و آناليز قرار گرفته و آماده ورود به برنامه مي‌شوند. اين مرحله از اهميت به سزايي برخوردار است. بر اين اساس دو عمل مهم بايد انجام گردد:
4-3-2-1- آناليز داده‌ها و تأييد صحت و دقت آن‌ها
در اين مرحله با بررسي دقيق تک تک داده‌ها مشکلات آن‌ها اعم از داده‌هاي بي‌مقدار و داده‌هاي خارج از محدوده را برطرف مي‌کنيم. در مورد داده‌هاي بي‌مقدار چند تکنيک مي‌توان استفاده کرد. اول اينکه مي‌توان آن داده‌ها را به کلي حذف کرد و يا اينکه ميانگيني از مقادير داده قبل و بعد را محاسبه کرده و آن را لحاظ کنيم. داده‌هاي خارج از محدوده نيز مي‌توان از طريق نمودارهاي ستوني که در نرم افزار وکا85 موجود مي‌باشند کمک گرفت و آنها را پيدا کرد و از مجموعه داده‌ها حذف کرد.

جدول 4-4 آناليز آماري داده هاي استفاده شده در مدل‌سازي گير لوله حفاري
پارامتر
واحد
Min.
Max.
St.Dev
Median
Average
Q (1)
Q (2)
Q (3)
E

1887105
1935965
53/13437
1915702
7/1912543
1900439
1915702
1921140
N

1005701
1054298
63/13806
1023859
5/1025933
1013070
1023859
1036403
D
Ft
164
17388
82/3890
03/9137
78/9049
96/6226
03/9137
34/12073
ROP
Ft/hr
0
58/173
64/14
7
18/10
28/3
7
3/12
F

10
95
33/26
26
36
15
26
65

Ft
64/1
8989
44/2827
85/2486
3/3427
87/944
85/2486
61/5790

In
75/4
25/16
29/0
3/0
4/0
2/0
31/0
54/2
WOB
1000b
0
80
25/13
25
25
18
25
30

Ft/hr
0
208
26/50
79
74
37
79
105

Psi
5/23
7/4523
37/1024
4/1661
1/1844
53/1174
4/1661
69/2456
M.F.Vis
Cp
0
100
33/14
45
44
35
45
54
Salt
PPM
0
490000
15/126633
320000
281334
280000
32000
0
343250
S
%
0
62
48/15
18
3/21
8
18
35
PV
Cp
0
120
51/25
20
28
7
20
40
YP
lb/100ft2
0
105
4/8
13
14
9
13
18
INGL
lb/100ft2
0
18
92/2
4
4
2
4
6
Min.10GL
lb/100ft2
0
22
35/3
5
6
4
5
8

Ft
30
925
75/231
174
263
58/88
88/173
1/410
RPM
Rpm
0
200
07/62
150
24/120
70
150
170
Stuck

0
1
34/0
0
0
0
0
0

4-3-2-2- همسان‌سازي داده‌ها
براي جلوگيري از بروز مشكل پراكندگي و قرار گرفتن تمام داده‌ها در يك بازه مشخص، معمولاً داده‌هاي ورودي قبل از انتقال به شبكه با استفاده از رابطه ذيل در بازة صفر و يك محدود مي‌شوند.
(4-11)

که در آن i از يک تا m تغيير مي‌کند. همچنين در اين رابطه، بيشترين و کمترين مقدار x خواهد بود.

4-3-3- تقسيم‌بندي داده‌ها
بعد از جمع‌آوري و پردازش كامل داده‌ها، نوبت به كار با شبكه عصبي مي‌رسد. به طور كلي داده‌هاي ورودي به شبکه‌هاي عصبي به سه بخش ذيل تقسيم مي‌گردند:
– مجموعه داده‌هاي آموزش: از اين مجموعه داده، براي ساخت شبکه عصبي استفاده مي‌شود.
– مجموعه داده‌هاي اعتبارسنجي: در حين ساخت شبکه با داده‌هاي آموزش، ممکن است شبکه براي دستيابي به عملکرد بهتر مقادير پارامتر هدف را حفظ کرده (به خاطر بسپارد) و خروجي خود را نزديک به داده‌هاي واقعي کند. براي جلوگيري از پيش آمدن چنين اتفاقي، يک قسمت از داده‌ها را با عنوان داده‌هاي اعتبار سنجي مشخص مي‌کنيم که پس از آموزش شبکه در هر مرحله، شبکه با اين دادها تست مي‌شود، تا ميزان واقعي بودن خروجي شبکه مشخص شود و در صورت فراهم شدن شرط پايان (مناسب بودن ميزان دقت شبکه) آموزش شبکه به پايان برسد.
– مجموعه داده‌هاي تست: پس از آن كه شبكه توسط داده‌هاي آموزش تا رسيدن به حداقل خطا آموزش يافت، مابقي داده‌ها كه در آموزش و اعتبارسنجي نقشي نداشته‌اند به عنوان ورودي به شبكه داده‌شده و پاسخ شبكه با پاسخ مطلوب مقايسه مي‌گردد و بدين ترتيب راندمان شبكه آموزش ديده، محك زده مي‌شود.
در اين بخش، مهم‌ترين مسئله چگونگي انتخاب مجموعه داده‌هاي مربوط به سه بخش ياد شده است. در بيشتر شبکه‌هاي عصبي معمولاً از 70 درصد داده‌ها براي آموزش، 15 درصد براي اعتبارسنجي و 15 درصد باقيمانده براى تست شبكه استفاده مي‌شوند. به طور كلي روش تقسيم اين داده‌ها به يك ديد خوب تحليلي از چگونگي عملكرد شبكه و توزيع مناسب داده‌هاي هر چاه در هر كدام از مجموعه داده‌ها نياز دارد. يكي از نكته‌هاي كليدي و بسيار مهم در تقسيم‌بندي داده‌ها اين است كه مقادير ماكزيمم و مينيمم هر پارامتر حتماً در مجموعه داده‌هاي آموزش قرار گيرند. در بخش مقاومت فشاري، داده‌ها به سه بخش 60، 15 و 25 درصد به ترتيب براي آموزش، اعتبار سنجي و تست شبکه تقسيم شدند. براي مدل‌سازي انتخاب مته و نرخ نفوذ، 70 درصد داده‌ها براي آموزش، 15 درصد براي اعتبارسنجي و 15 درصد باقيمانده نيز براي تست شبکه به کار برده شدند. در بخش سوم، 60 درصد داده‌ها براي آموزش، 20 درصد براي اعتبارسنجي و 20 درصد باقيمانده نيز براي تست شبکه به کار برده شدند و در بخش چهارم، 60 درصد داده‌ها براي آموزش، 15 درصد براي اعتبارسنجي و 25 درصد باقيمانده نيز براي تست شبکه به کار برده شدند. با تقسيم‌بندي داده‌ها به سه گروه اصلي، كار با برنامه آغاز مي‌گردد.

4-4- مدل کردن
پس از انجام مراحل قبل، داده‌ها براي مدل‌سازي آماده هستند. در اين مرحله شبکه عصبي مناسب با توجه به مزيت‌ها و معايب آن‌ و هدف ما از انجام کار انتخاب مي‌شود. در اين مرحله نوع شبکه عصبي، ساختار و اجزاء آن انتخاب مي‌شود. پس از انتخاب شبکه مورد نظر بايد ساختار آن از جمله تعداد لايه‌هاي مخفي و تعداد نرون آن مشخص شود. همچنين شرط پايان مرحله آموزش نيز براي شبکه در اين مرحله تعيين مي‌شود. در اين بخش از شبکه‌هاي عصبي مصنوعي و الگوريتم‌هاي بهينه سازي براي ايجاد مدل مناسب استفاده مي‌کنيم.

4-5- معيارهاي عملكرد
جهت بررسي عملكرد مدل‌ها و مقايسه نتايج، معيارهايي لازم است تا در تحقيق مورد استفاده قرار گيرد كه از بين معيارهاي مرسوم از ضريب رگرسيون86 ()، ضريب تعيين87 () و ميانگين مربع خطا88 (MSE) استفاده گرديد. مقدار بيانگر ارتباط بين داده‌هاي واقعي و مدل بوده كه مقدار آن بين منفي يک تا يک است؛ که مقدار منفي يک نشان دهنده رابطه معکوس و رابطه يک نشان دهنده رابطه مستقيم و مقدار صفر نشان دهنده عدم وجود رابطه بين داده‌ها مي‌باشد. مقدار اين متغير از رابطه (4-12) بدست مي‌آيد. مقدار ضريب رگرسيون به توان دو است. در صورتي که اختلاف زيادي بين داده‌هاي واقعي و مدل وجود داشته باشد، معيار ضريب رگرسيون به تنهايي نمي‌تواند بيانگر رابطه قوي بين داده‌ها باشد. بنابراين از معيار ديگري كه بيانگر وضعيت اختلاف بين داده‌هاي واقعي و مدل است، استفاده مي‌شود. بدين منظور معيار MSE مورد استفاده قرار گرفت. هر چه مقدار اين معيار کمتر باشد نشان از دقت بالاتر مدل است. مقدار MSE به کمک رابطه (4-13) محاسبه مي‌شود.

(4-12)

در معادله فوق و هر يک از داده‌ها و و ميانگين کل داده‌هاي پيش‌بيني شده و واقعي مي‌باشند.

(4-13)

که در اين فرمول مقدار خروجي شبکه براي بردار داده i ام، مقدار واقعي داده براي بردار داده i ام و n تعداد کل داده هاي در دسترس است.

فصل پنجم: آناليز و تحلي
ل اطلاعات

5-1- مقدمه
همان‌طور که بيان شد هدف اين پروژه بهبود انتخاب مته و نرخ نفوذ حفاري، تعيين مقاومت فشاري تک محوره سنگ سازند، پيش‌بيني و کاهش هرزروي سيال حفاري و پيش‌بيني و کاهش احتمال گير لوله حفاري مي‌باشد. در اين فصل به کمک روش‌هاي هوش مصنوعي بيان شده در فصل 3 و داده‌هاي تصحيح شده در فصل 4، مدل‌سازي براي دستيابي به هدف مورد نظر انجام مي‌شود و نتايج براي بيان وضعيت مدل ارائه مي‌شود.

5-2- مقاومت فشاري تک محوره سنگ سازند
براي پيش‌بيني مقاومت فشاري تک محوره سنگ سازند دو مدل را توسعه داديم. مدل شبکه عصبي پرسپترون چند لايه و مدل شبکه عصبي پرسپترون بهينه شده توسط الگوريتم ژنتيک، و نتايج هر دو مدل را از لحاظ دقت و زمان محاسبات مورد بررسي قرار داده و بهترين مدل را براي استفاده در عمليات حفاري آينده انتخاب کرديم. از آنجايي که بهترين مدل‌سازي‌ انجام شده در اين بخش توسط شبکه عصبي پرسپترون انجام شد، در اين بخش سعي شده عملکرد اين شبکه مورد بررسي قرار گرفته و براي افزايش کارايي آن پيشنهاداتي ارائه گردد.

5-2-1- روش کار
5-2-1-1- پيش‌بيني UCS توسط MLP
پرسپترون چندلايه يکي از شايع‌ترين شبکه‌هاي عصبي مصنوعي پيشخور است که با استفاده از روش شرح داده‌ شده در فصل 3، ورودي‌ها را به خروجي مرتبط مي‌کند. معمولاً، لايه‌هاي داخلي پرسپترون چندلايه به طور کامل با يکديگر متصل مي‌شوند.
از آنجا که، در اين مطالعه ما مي‌خواهيم شبکه‌هاي عصبي مصنوعي را به عنوان يک مسئله بهينه‌سازي نگاه کنيم، بنابراين، بهتر است به معرفي پيچيدگي يادگيري آن پرداخت. معمولاً، خطا در شبکه عصبي با معيارهاي مختلف اندازه گيري مي‌شود. يکي از اين معيارها ميانگين مربع خطا است، که طبق فرمول (4-12) برابر است با:
(4-12)

همان‌طور که گفته شد، وزن‌ها در شبکه عصبي به منظور کاهش خطا و افزايش سازگاري تغيير مي‌يابند. بنابراين، با استفاده از گراديان نزولي، تغييرات در وزن به اين صورت است:

(5-1)

که در آن خروجي نرون قبلي و نرخ يادگيري است که تغييرات در وزن و همگرايي را کنترل مي‌کند. به عنوان مثال، با استفاده از يک مقدار زياد سرعت يادگيري، منجر مي‌شود که عملکرد الگوريتم بسيار سريع شود، اما ممکن است در منيمم محلي به دام افتد. در حالي که، انتخاب مقدار کوچک براي اين متغير مي‌تواند باعث عملکرد آهسته الگوريتم شود و زمان محاسبات را افزايش دهد. تغييرات خطا بسته به حوزه محلي ناشي مي‌شود. بنابراين، مي‌توان مشتق آن را براي يک گره خروجي به صورت زير نوشت:

(5-2)

که در آن مشتق تابع فعال‌سازي است. بديهي است، که بسياري از پارامترها به همديگر بستگي دارند و در نتيجه نشان دادن همه معادله را سخت مي‌کند. براي مثال، مشتق مرتبط هست:

(5-3)

روشن است که وابستگي در وزن‌هاي جديد و قبلي وجود دارد، بنابراين، براي پيدا کردن وزن جديد در لايه پنهان، وزن قبلي بر طبق مشتق تابع فعال تغيير مي‌کند به همين دليل به اين الگوريتم پس انتشار مي‌گويند [73].
با توجه به شکل 3-3 و فرمول‌هاي فوق، روشن است که يک بار محاسباتي بزرگ در شبکه عصبي وجود دارد. بنابراين، به احتمال بسيار زياد شبکه در کمينه محلي به دام مي‌افتد به خصوص اگر داده‌هاي زيادي خطا داشته باشند و از الگوريتم‌هاي يادگيري محلي استفاده شود.
به همين دليل، مي‌توان براي کاهش بار محاسباتي و تعيين مقادير مناسب متغيرها (وزن‌ها و


دیدگاهتان را بنویسید